Burrows-Wheeler Aligner (BWA) är ett effektivt program som anpassar relativt korta nukleotidsekvenser mot en lång referenssekvens som det mänskliga genomet. Vad är nytt i den här versionen:.
Programvaran implementerar två algoritmer, BWA-kort och BWA-SW. De tidigare arbeten för frågesekvenser kortare än 200 bp och den senare för längre sekvenser upp till omkring 100kbp.
Båda algoritmerna gör diskontinuerliga inriktning. De är oftast mer exakt och snabbare på frågor med låga felprocent. Se BWA manualsidan för mer information.
Har BWA rikta 454 läser?
& Nbsp; Ja och nej. Den BWA-SW komponenten i BWA fungerar bra på 454 läser om 200 bp eller längre. Det uppnår liknande inriktning noggrannhet SSAHA2 samtidigt mycket snabbare. BWA-SW fungerar även för kortare läser, men känsligheten är lägre. Dessutom gör BWA-SW stöder inte parade slut inriktning.
Vad är maximal frågesekvenslängd i linje?
& Nbsp; Det rekommenderas att bara använda bwa-kort på läser kortare än 200 bp. Även BWA-kort fungerar i upp till ett par kbp fråga i princip är dess prestanda försämras. För långa läser, är BWA-SW bättre.
& Nbsp; Den BWA-SW-komponenten kan rikta en BAC sekvens (ca 150kbp) mot det mänskliga genomet. Hastigheten i termer av inriktade baser per tidsenhet är jämförbar med hastigheten för 1kbp läsa uppriktning. I princip bör BWA-SW kunna rikta några Mbp frågesekvens på en liknande hastighet, men jag har inte provat.
Vad är tolerans av sekvensfel?
& Nbsp; Bwa-kort är främst avsedd för sekvense felfrekvensen under 2%. Även användare kan be den att tolerera fler fel av tuning kommandoradsalternativ, är dess prestanda snabbt försämras. Observera att för Illumina läser, kan bwa-kort eventuellt trim låg kvalitet baser från 3'-änden före justering och därmed har möjlighet att anpassa mer läser med hög felprocent i svansen, vilket är typiskt för Illumina uppgifter.
& Nbsp; BWA-SW tolererar fler fel ges längre anpassning. Simulering antyder att BWA-SW kan fungera bra med tanke på 2% fel för en 100 bp uppriktning, 3% fel för en 200 bp, 5% för 500 bp och 10% för 1000bp eller längre anpassning.
Har BWA hitta chimär läser?
& Nbsp; Ja, BWA-SW-komponent kunna hitta chimär. BWA rapporterar vanligtvis en anpassning för varje läsa men kan mata ut två eller flera inriktningar om läs / contig är en chimär.
Har BWA samtals SNP som MAQ?
& Nbsp; Nej, BWA gör bara anpassning. Ändå matar det anpassningar i SAM-format som stöds av flera generiska SNP ringer såsom samtools och GATK.
Jag ser en läsning i ett par har hög kartläggning kvalitet, men den andra läsning har noll. Är detta rätt?
& Nbsp; Det här är korrekt. Kartläggning kvalitet tilldelas för individuell läsning, inte för en läsning par. Det är möjligt att en läsning kan mappas entydigt, men dess kompis faller i en tandom upprepning och därmed sin exakta positionen kan inte bestämmas.
Jag ser en läsning står ut i slutet av en kromosom och flaggas som unmapped (flagga 0x4). Vad händer här?
& Nbsp; Internt BWA sammanfogar alla referenssekvenser i en lång sekvens. Ett läst kan kartläggas till korsningen av två intilliggande referenssekvenserna. I detta fall kommer BWA flagga läsas som omappade, men du kommer att se position, cigarr och alla taggar. En bättre lösning vore att välja en alternativ position eller trimma anpassning av slutet, men det är ganska komplicerat i programmering och inte genomförs för närvarande.
Fungerar BWA arbete med referenssekvenser längre än 4GB totalt?
& Nbsp; Nej, det är inte möjligt och kommer inte att stödjas inom den närmaste framtiden på grund av den tekniska komplexiteten.
Errata strong>
Suffixet array intervall en tom sträng bör [0, n-1] där n är längden på databas sträng, inte [1, n-1] som anges i Li och Durbin (2009 och 2010). På motsvarande sätt måste vi definiera O (a, -1) = 0 och revidera pseudokod i figur 3 från Li och Durbin (2009). Genomförande BWA är faktiskt korrekt. Misstaget uppstår bara på papperet. Vi ber om ursäkt för den förvirring och tackar Nils Homer och Abel Antonio Carrion Collado för att peka ut detta p>
Mjukvaruinformation:
Version: 0.6.1
Ladda upp dagen: 14 Apr 15
Licens: Gratis
Popularitet: 58
Kommentarer hittades inte