BWA (выравнивание биологических последовательностей)
программное обеспечение | |
BWA | |
Тип | Биоинформатика |
---|---|
Разработчик | Li H.,Durbin R. |
Операционная система | UNIX, Linux} |
Последняя версия | BWA-0.7.13 (23.02.2016) |
Лицензия | GNU General Public License, MIT License |
Сайт | bio-bwa.sourceforge.net |
BWA — (англ. Burrows — Wheeler Aligner) — это программный пакет для картирования чтений на большие референсные геномы (такие как, например, геном человека), написанный китайским биоинформатиком Хенгом Ли (Heng Li) и англичанином Ричардом Дурбиным (Richard M. Durbin). Он состоит из трех основных алгоритмов: BWA-backtrack, BWA-SW и BWA-MEM. BWA-SW использует преобразование Барроуза—Уилера и алгоритм выравнивания Смита—Ватермана. Умеет работать с длинными последовательностями, является на порядок быстрее, чем MAQ (maq.sourceforge.net) при достижении аналогичной точности выравнивания[1].
Первый алгоритм предназначен для ридов с Illumina до 100 п.о., в то время как два остальных для более длинных последовательностей от 70 п.о. до 1М п.о.. BWA-MEM и BWA-SW имеют схожие функции, такие как поддержка длинных прочтений и split-выравнивания. BWA-MEM, который является последним, как правило, рекомендуется для высококачественных запросов, так как он быстрее и точнее. BWA-MEM также имеет лучшую производительность, чем BWA-BackTrack для Illumina ридов 70-100 п.о.
Для всех алгоритмов, BWA сначала должен построить FM-индекс для эталонного генома (команда индекса). Алгоритмы выравнивания вызываются различными подкомандами: aln/samse/sampe для BWA-backtrack, bwasw для BWA-SW и mem для BWA-MEM[2].
История[править]
Хенг Ли начал писать первую часть кода 24 мая 2008 года и получил первоначальную стабильную версию 2 июня 2008 г. В этот же период профессор Tak-Wah Lam, первый автор статьи BWT-SW, сотрудничал с Пекинским геномным институтом в работе над SOAP2, преемником SOAP (пакет анализа коротких олигонуклеотидных последовательностей). SOAP2 вышел в ноябре 2008 г. Согласно странице загрузки SourceForge, третий BWT на основе выранивания коротких чтений, bowtie, был впервые выпущен в августе 2008 года[3].
Алгоритм BWA-SW является новым компонентом BWA. Он был задуман в ноябре 2008 года и был реализован через десять месяцев.
Использование[править]
BWA предназначен для картирования чтений на большие референсные геномы. Каждый алгоритм вызывается отдельной командой, принимает входной файл через стандартный поток ввода (stdin) и возвращает результат через стандартный поток вывода (stdout).
BWA-MEM[править]
Источники[править]
- ↑ Fast and accurate long-read alignment with Burrows-Wheeler transform, Li H, Durbin R, Bioinformatics, 2010 Mar 1;26(5):589-95, PMID: 20080505
- ↑ Burrows-Wheeler Aligner
- ↑ Bowtie: An ultrafast, memory-efficient short read aligner