BWA (выравнивание биологических последовательностей)

Материал из Циклопедии
Перейти к навигации Перейти к поиску
программное обеспечение
BWA
ТипБиоинформатика
РазработчикLi H.,Durbin R.
Операционная системаUNIX, Linux}
Последняя версияBWA-0.7.13 (23.02.2016)
ЛицензияGNU General Public License, MIT License
Сайтbio-bwa.sourceforge.net

BWA — (англ. Burrows — Wheeler Aligner) — это программный пакет для картирования чтений на большие референсные геномы (такие как, например, геном человека), написанный китайским биоинформатиком Хенгом Ли (Heng Li) и англичанином Ричардом Дурбиным (Richard M. Durbin). Он состоит из трех основных алгоритмов: BWA-backtrack, BWA-SW и BWA-MEM. BWA-SW использует преобразование Барроуза—Уилера и алгоритм выравнивания Смита—Ватермана. Умеет работать с длинными последовательностями, является на порядок быстрее, чем MAQ (maq.sourceforge.net) при достижении аналогичной точности выравнивания[1].

Первый алгоритм предназначен для ридов с Illumina до 100 п.о., в то время как два остальных для более длинных последовательностей от 70 п.о. до 1М п.о.. BWA-MEM и BWA-SW имеют схожие функции, такие как поддержка длинных прочтений и split-выравнивания. BWA-MEM, который является последним, как правило, рекомендуется для высококачественных запросов, так как он быстрее и точнее. BWA-MEM также имеет лучшую производительность, чем BWA-BackTrack для Illumina ридов 70-100 п.о.

Для всех алгоритмов, BWA сначала должен построить FM-индекс для эталонного генома (команда индекса). Алгоритмы выравнивания вызываются различными подкомандами: aln/samse/sampe для BWA-backtrack, bwasw для BWA-SW и mem для BWA-MEM[2].

История[править]

Хенг Ли начал писать первую часть кода 24 мая 2008 года и получил первоначальную стабильную версию 2 июня 2008 г. В этот же период профессор Tak-Wah Lam, первый автор статьи BWT-SW, сотрудничал с Пекинским геномным институтом в работе над SOAP2, преемником SOAP (пакет анализа коротких олигонуклеотидных последовательностей). SOAP2 вышел в ноябре 2008 г. Согласно странице загрузки SourceForge, третий BWT на основе выранивания коротких чтений, bowtie, был впервые выпущен в августе 2008 года[3].

Алгоритм BWA-SW является новым компонентом BWA. Он был задуман в ноябре 2008 года и был реализован через десять месяцев.

Использование[править]

BWA предназначен для картирования чтений на большие референсные геномы. Каждый алгоритм вызывается отдельной командой, принимает входной файл через стандартный поток ввода (stdin) и возвращает результат через стандартный поток вывода (stdout).

BWA-MEM[править]

Источники[править]

  1. Fast and accurate long-read alignment with Burrows-Wheeler transform, Li H, Durbin R, Bioinformatics, 2010 Mar 1;26(5):589-95, PMID: 20080505
  2. Burrows-Wheeler Aligner
  3. Bowtie: An ultrafast, memory-efficient short read aligner