Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Alioth page.
Summary
Next generation sequencing
Debian Med bioinformatics applications usable in Next Generation Sequencing

It aims at gettting packages which specializes in alignment of sequences produced by next generation sequencing.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Next generation sequencing packages

Official Debian packages with high relevance

Bcftools
Genomisk variantkald og manipulering af VCF/BCF-filer
Versions of package bcftools
ReleaseVersionArchitectures
stretch1.3-3amd64,arm64,armel,mipsel,ppc64el
sid1.3-3amd64,arm64,armel,kfreebsd-amd64,mipsel,ppc64el
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

BCFtools er et sæt af redskaber, som manipulerer variantkald i Variant Call Format (VCF) og dets binære modpart BCF. Alle kommandoer fungerer gennemsigtigt med både VCF'er og BCF'er, både uden komprimering og komprimeret med BGZF.

Bedtools
Programpakke med redskaber for sammenligning af arvemassefunktioner
Versions of package bedtools
ReleaseVersionArchitectures
wheezy2.16.1-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie2.17.0-1ia64,s390
sid2.17.0-1ia64,s390
jessie2.19.1-1sparc
sid2.19.1-1sparc
jessie2.21.0-1amd64,arm64,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x
stretch2.25.0-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid2.25.0-1amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 33 users (18 upd.)*
Versions and Archs
License: DFSG free
Git

BEDTools-redskaber giver mulighed for at adressere gængse arvemasseopgaver såsom at finde funktionsoverlap og beregne dækning. Redskaberne er hovedsagelig baseret på fire meget udbredte filformater: BED, GFF/GTF, VCF og SAM/BAM. Med brug af BEDTools kan du udvikle sofistikerede datakanaler, som besvarer komplicerede forskningsspørgsmål ved at udsende flere BEDTools sammen.

Redskabet groupBy er distribueret i pakken filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Blasr
Kortlægning af enkelte molekylesekventeringslæsninger
Versions of package blasr
ReleaseVersionArchitectures
stretch0~20151014+git8e668be-1amd64,arm64,armel,i386,mipsel,ppc64el
sid0~20151014+git8e668be-1amd64,arm64,armel,i386,kfreebsd-amd64,kfreebsd-i386,mips64el,mipsel,ppc64el
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Grundlæggende lokal opsætning med successiv raffinement (BLASR) er en metode til kortlægning af enkelte molekylesekventeringslæsninger mod et referencegenom. En sådan læsning er tusindvis af baser lang, med divergens mellem dem og genomet bliver domineret af indsættelses- og slettefejl.

Bowtie
Ultrahurtig og hukommelseseffektiv short read-sammenligner
Versions of package bowtie
ReleaseVersionArchitectures
wheezy0.12.7-3amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,powerpc,s390,s390x,sparc
jessie1.0.0-5s390
sid1.0.0-5ia64,s390
jessie1.1.1-2amd64,kfreebsd-amd64
stretch1.1.2-3amd64,arm64,ppc64el
sid1.1.2-3amd64,arm64,kfreebsd-amd64,ppc64el
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 22 users (12 upd.)*
Versions and Archs
License: DFSG free
Svn

Denne pakke adresserer problemet med at fortolke resultaterne fra de seneste (2010) DNA-sekvensteknologier. Disse vil resultere i ret så korte stræk og disse kan ikke fortolkes direkte. Det er udfordringen for værktøjer såsom Bowtie at give en kromosonplacering til korte stræk af DNA sekventeret per kørsel.

Bowtie sammenligner korte DNA-sekvenser (læsninger) for den menneskelige arvemasse med en hastighed på mere end 25 millioner 35-bp læsninger per time. Bowtie indekserer arvemassen med et Burrows-Wheeler-indeks for at holde hukommelsesaftrykket lavt: Typisk omkring 2,2 GB for den menneskelige arvemasse (2,9 GB for paired-end).

The package is enhanced by the following packages: bowtie-examples
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Bwa
Burrows-Wheeler Aligner (sekvenssammenligner)
Versions of package bwa
ReleaseVersionArchitectures
squeeze0.5.8c-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy0.6.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.6.2-1s390
sid0.6.2-1s390
jessie0.7.10-1amd64,kfreebsd-amd64
stretch0.7.13-1amd64
sid0.7.13-1amd64,kfreebsd-amd64
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 28 users (52 upd.)*
Versions and Archs
License: DFSG free
Git

Burrows-Wheeler Aligner (BWA) er en programpakke, for oversættelse af lavafvigende sekvenser mod en stor referencearvemasse, såsom den menneskelige arvemasse. Den består af tre algoritmer: BWA-backtrack, BWA-SW og BWA-MEM. Den første algoritme er designet for Illunina-sekvenslæsninger op til 100 bp, mens de sidste to er for længere sekvenser fra 70 bp til 1 Mbp. BWA-MEM og BWA-SW deler funktioner såsom understøttelse af long-read og opdelingssammenligning, men BWA-MEM, som er den seneste, anbefales generelt for højkvalitets forespørgsler, da den er hurtigere og mere præcis. BWA-MEM har også bedre ydelse end BWA-backtrack for 70-100 bp Illumina-læsninger.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Daligner
Lokal tilpasningsregistrering mellem lange nukleotidsekventeringslæsninger
Versions of package daligner
ReleaseVersionArchitectures
stretch1.0+20151214-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.0+20151214-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Disse værktøjer gør det muligt at finde alle signifikante lokale tilpasninger mellem læsninger kodet i en Dazzler-database. Antagelsen er at læsningerne er fra en »Pacific Biosciences RS II long read sequencer«. Det vil sige, at læsningerne er lange og usikre, op til 15 % i gennemsnit.

Please cite: Gene Myers: Efficient Local Alignment Discovery amongst Noisy Long Reads. 8701:52-67 (2014)
Dindel
Bestemmer indel-kald fra kort-læst data
Versions of package dindel
ReleaseVersionArchitectures
stretch1.01+dfsg-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.01+dfsg-1amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Dindel er et program til at kalde små »indels« fra kort-læst sekvensdata (»næstegenerations sekvensdata«). Er i øjeblikket designet til kun at håndtere Illumina-data.

Dindel kræver en BAM-fil indeholdende læs-sammenligninger som inddata. Programmet udtrækker så kandidat-indels fra BAM-filen, og laver ny sammenligning af læsningerne for at kandidere haplotyper bestående af disse kandidat-indels. Hvis der er tilstrækkelig evidens for en alternativ haplotype til referencen, så vil programmet kalde en indel.

Det er muligt at teste indels registret med andre metoder via brug af Dindel, for eksempel længere indels indhentet via samlingsmetoder. Dindel vil så lave sammenligning for både oversatte og ej oversatte læsninger for at se om kandidat-indelen er understøttet af læsningerne.

Dindel viser både genotypesandsynligheder og inkluderer et skript til at konvertere disse til en VCF-fil med indel- og SNP-kald.

Der er grundlæggende understøttelse for visning af nye udredede BAM-filer for hvert udredningsvindue. Disse udredede BAM-filer kan bruges til at kalde SNP'er tæt på (kandidat) indels.

Please cite: Cornelis A. Albers, Gerton Lunter, Daniel G. MacArthur, Gilean McVean, Willem H. Ouwehand, Richard Durbin: ???. (PubMed,eprint) Genome Research 21(6):961-973 (2010)
Fastx-toolkit
forbehandlingsværktøjer til læsning af korte FASTQ/A-nukleotider
Versions of package fastx-toolkit
ReleaseVersionArchitectures
wheezy0.0.13.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.0.13.2-1s390
sid0.0.13.2-1s390
jessie0.0.14-1amd64,arm64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,ppc64el,s390x
stretch0.0.14-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid0.0.14-1amd64,arm64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Debtags of package fastx-toolkit:
roleprogram
Popcon: 16 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

FASTX-Toolkit er en samling af kommandolinjeværktøjer for forbehandling af korte nukleotidlæsninger i FASTA- og FASTQ-formater, normalt udarbejdet af Next-Generation sekvensmaskiner. Hovedbehandlingen af sådanne FASTA/FASTQ-filer er oversættelse (justering) af sekvenserne til referencegenomer eller andre databaser der bruger specialiserede programmer såsom BWA, Bowtie og mange andre. Det er dog undertiden mere produktivt at forbehandle FASTA/FASTQ-filerne, forud for oversættelse af sekvenserne til genom-manipulering, for at fremstille bedre oversættelsesresultater. FASTX-Toolkit-værktøjer udfører nogle af disse forbehandlingsopgaver.

Filo
FILe og stream-operationer
Versions of package filo
ReleaseVersionArchitectures
wheezy1.1+2011020401.2amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie1.1+2011020401.2s390
sid1.1+2011020401.2s390
jessie1.1+2011123001.1amd64,arm64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x,sparc
sid1.1+2011123001.1ia64,sparc
stretch1.1.0-3amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.1.0-3amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Popcon: 15 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

De følgende værktøjer er tilgængelige som en del af pakken filo:

groupBy - efterligner »groupBy«-klausulen i databasesystemer.

shuffle - gør rækkefølgen for linjer i en fil vilkårlig.

stats - beregner beskrivende statistik på en given kolonne i en indrykningsafgrænset fil eller strøm.

Da deres navne er for generiske, bliver »shuffle« og »stats« flyttet i /usr/lib/filo.

Kissplice
Detektion af diverse slags polymorfismer i RNA-sekvensdata
Versions of package kissplice
ReleaseVersionArchitectures
jessie1.8.3-1ia64,s390
sid1.8.3-1s390
jessie2.1.0-1sparc
sid2.1.0-1hurd-i386,ia64
jessie2.2.1-3amd64,arm64,kfreebsd-amd64,ppc64el
stretch2.3.1-1amd64,arm64,ppc64el
sid2.3.1-1amd64,arm64,kfreebsd-amd64,mips64el,ppc64el
upstream2.4.0
Debtags of package kissplice:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 9 users (3 upd.)*
Newer upstream!
License: DFSG free
Svn

KisSplice er et program, som gør det muligt at analysere RNA-sekvensdata med eller uden en referencearvemasse. Det er en præcis lokal transcriptome assembler hvor du kan identificere SNP'er, indels og alternative splicing-hændelser. Programmet kan håndtere et arbitrært antal biologiske betingelser og vil kvantificere hver variant i hver betingelse. Programmet er blevet testet på Illumina-datasæt på op til 1G-læsninger. Dets hukommelsesforbrug er omkring 5 Gb for 100 millioner læsninger.

Please cite: Gustavo AT Sacomoto, Janice Kielbassa, Rayan Chikhi, Raluca Uricaru, Pavlos Antoniou, Marie-France Sagot, Pierre Peterlongo and Vincent Lacroix: KISSPLICE: de-novo calling alternative splicing events from RNA-seq data. (PubMed,eprint) BMC Bioinformatics 13((Suppl 6)):S5 (2012)
Last-align
sammenligning af biologisk sekvenser på genom-skala
Versions of package last-align
ReleaseVersionArchitectures
squeeze128-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy199-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie199-1s390
jessie359-1ia64
sid359-1s390
sid393-1ia64
jessie418-1sparc
jessie490-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x
sid588-1sparc
stretch731-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid731-1amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
upstream737
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 12 users (18 upd.)*
Newer upstream!
License: DFSG free
Git

LAST er programmel til sammenligning og justering af sekvenser, typisk DNA- eller protein-sekvenser. LAST ligner BLAST, men det er bedre til at håndtere meget store mængder af sekvensdata. Her er to ting som LAST er god til:

 • Sammenligning af store (eksempelvis pattedyrs) genomer.
 • Kortlægge masser af sekvens-mærker oven på et genom.

Den primære, tekniske innovation er at LAST finder indledende samstemmende forekomster, baseret på deres mangfoldighed, i stedet for at benytte en fast størrelse (BLAST bruger eksempelvis 10-mers). Dette gør, at man kan kortlægge mærker til genomer, uden gentagelsesmaskering (eng. »repeat- masking«), uden at blive overvældet af gentagne forekomster. For at finde disse forekomster som har forskellige størrelser, så bruger den en suffiks- række (inspireret af Vmatch). For at opnå høj følsomhed, så bruger den en usammenhængende suffiks-række, der er en analog til frø som placeres med mellemrum.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Maq
kortlægger korte, fast-længde, polymorfiske DNA-sekvenslæsninger til reference-sekvenser
Versions of package maq
ReleaseVersionArchitectures
squeeze0.7.1-3amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy0.7.1-5amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.7.1-5amd64,arm64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390,s390x,sparc
sid0.7.1-5ia64,s390,sparc
stretch0.7.1-6amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid0.7.1-6amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 16 users (13 upd.)*
Versions and Archs
License: DFSG free
Svn

Maq (forkortelse af »Mapping and Assembly with Quality«) bygger kortlagte montager fra korte læsninger genereret af næste generation inden for maskiner til sekvensering. Det blev særligt designet til »Illumina-Solexa 1G Genetic Analyzer«, og har indledende funktionalitet til at håndtere ABI SOLid-data. Maq var tidligere kendt som mapass2.

Udvikling af Maq stoppede i 2008. Dets efterfølger er BWA og SAMtools.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Mhap
locality-sensitive hashing to detect long-read overlaps
Versions of package mhap
ReleaseVersionArchitectures
stretch1.6+dfsg-1all
sid1.6+dfsg-1all
upstream2.0
Popcon: 2 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

The MinHash Alignment Process (MHAP) overlaps noisy, long reads using probabilistic, locality-sensitive hashing. Integrating MHAP with the Celera Assembler enabled reference-grade de novo assemblies of Saccharomyces cerevisiae, Arabidopsis thaliana, Drosophila melanogaster and a human hydatidiform mole cell line (CHM1) from single-molecule real-time sequencing.

Please cite: Konstantin Berlin, Sergey Koren, Chen-Shan Chin, James P Drake, Jane M Landolin and Adam M Phillippy: Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. (PubMed) Nature Biotechnology 33(6):623–630 (2015)
Mira-assembler
Hel Genome Shotgun og EST Sequence Assembler
Versions of package mira-assembler
ReleaseVersionArchitectures
wheezy3.4.0.1-3amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie3.9.18-1ia64,s390
sid3.9.18-1s390
jessie4.0-1sparc
sid4.0-1ia64
jessie4.0.2-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x
sid4.9.5-1sparc
stretch4.9.5-5amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid4.9.5-5amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Debtags of package mira-assembler:
roleprogram
Popcon: 10 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Mira er en specialiseret gensekvenssamler for sekvensprojekter regnet som »svære« på grund af et stort antal ensformige gentagelser. For expressed sequence tags-transskriptioner (EST'er) er miraEST specialiseret på rekonstruktion af urørte mRNA-transskriptioner mens det detekterer og klassificerer enlige nukleotidpolymorfismer (SNP), der opstår i forskellige variationer herudfra.

Sekvenssamleren bruges rutinemæssigt til forskellige opgaver såsom mutationsdetektering i forskellige celletyper, analyser af ligheder i transskriptioner mellem organismer og samling af urørte sekvenser fra forskellige kilder for oligodesign i kliniske mikroarrayeksperimenter.

Pakken tilbyder følgende kørbare filer:

 • mira: for samling af genomsekvenser
 • miramem: estimerer hukommelsen krævet af et projekt. Fungerer ved at lænke til mira.
 • convert_project: til konvertering af projektfiltyper til andre typer
 • caf2fasta, caf2gbf, caf2text, caf2html, gbf2caf og gbf2fasta er nogle ofte anvendte filkonverteringsprogrammer (fungerer ved at lænke til convert_project)
 • scftool: Værktøjssæt som er nyttigt når der arbejdes med SCF-sporfiler
 • fastatool: Værktøjssæt som er nyttigt når der arbejdes med FASTA- sporfiler

 • fasta2frag: fragmentering af sekvenser til mindre, overlappende sekvenser. Nyttig til simulering af haglgeværsekvenser. Kan oprette undersekvenser i begge retninger (/default) og også parrede slutsekvenser.

 • fastaselect: givet en FASTA-fil (og eventuelt en FASTA- kvalitetsfil) og en fil med navne til læsning, vælges sekvenserne fra FASTA (og kvalitetsfil) og skrives til en resulterende FASTA
 • fastqselect: ligesom fastaselect.tcl, men til FASTQ
 • fixACE4consed: Consed indeholder en fejl som gør det umuligt for den at læse konsensusmærker i ACE-filer skrevet af MIRA-samleren (og muligvis andre programmer). Dette skript behandler en ACE-fil sådan at consed kan læse konsensusmærkerne.
Please cite: Bastien Chevreux, Thomas Pfisterer, Bernd Drescher, Albert J. Driesel, Werner E. G. Müller, Thomas Wetter and Sándor Suhai: Using the miraEST Assembler for Reliable and Automated mRNA Transcript Assembly and SNP Detection in Sequenced ESTs. (PubMed,eprint) Genome Research 14(6):1147-1159 (2004)
Mothur
Programpakke for sekvensanalyse til forskning i mikrobiota
Versions of package mothur
ReleaseVersionArchitectures
wheezy1.24.1-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
sid1.24.1-1s390
jessie1.31.2+dfsg-2ia64
sid1.31.2+dfsg-2ia64
jessie1.33.3+dfsg-1sparc
jessie1.33.3+dfsg-2amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el
sid1.33.3+dfsg-2sparc
stretch1.36.1-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.36.1-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Debtags of package mothur:
roleprogram
Popcon: 11 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Mothur søger at udvikle et enkelt stykke open source program, der kan udvides til at fylde bioinformatikbehov i mikrobiel økologisamfund. Den har indbygget funktionalitet for dotur, sons, treeclimber, s-libshuff, unifrac og meget mere. Ud over at forbedre fleksibiliteten af disse algoritmer er en række andre funktioner, herunder regnemaskiner og visualiseringsværktøjer, blevet tilføjet.

Please cite: Patrick D Schloss, Sarah L Westcott, Thomas Ryabin, Justine R Hall, Martin Hartmann, Emily B Hollister, Ryan A Lesniewski, Brian B Oakley, Donovan H Parks, Courtney J Robinson, Jason W Sahl, Blaz Stres, Gerhard G Thallinger, David J Van Horn and Carolyn F Weber: Introducing mothur: Open-source, platform-independent, community-supported software for describing and comparing microbial communities. (PubMed) Appl Environ Microbiol 75(23):7537-7541 (2009)
Picard-tools
Command line tools to manipulate SAM and BAM files
Versions of package picard-tools
ReleaseVersionArchitectures
squeeze1.27-1all
wheezy1.46-1all
jessie1.95-1all
sid1.100-1all
jessie1.105-1all
sid1.105-1all
jessie1.110-1all
jessie1.113-1all
sid1.113-1all
stretch1.138+dfsg.1-1all
sid2.1.1+dfsg-1all
upstream2.2.0
Popcon: 26 users (22 upd.)*
Newer upstream!
License: DFSG free
Git

SAM (Sequence Alignment/Map) format is a generic format for storing large nucleotide sequence alignments. Picard Tools includes these utilities to manipulate SAM and BAM files:

 AddCommentsToBam         FifoBuffer
 AddOrReplaceReadGroups      FilterSamReads
 BaitDesigner           FilterVcf
 BamIndexStats           FixMateInformation
 BamToBfq             GatherBamFiles
 BedToIntervalList         GatherVcfs
 BuildBamIndex           GenotypeConcordance
 CalculateHsMetrics        IlluminaBasecallsToFastq
 CalculateReadGroupChecksum    IlluminaBasecallsToSam
 CheckIlluminaDirectory      LiftOverIntervalList
 CheckTerminatorBlock       LiftoverVcf
 CleanSam             MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics  MarkDuplicates
 CollectBaseDistributionByCycle  MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics       MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics    MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics    MergeSamFiles
 CollectInsertSizeMetrics     MergeVcfs
 CollectJumpingLibraryMetrics   NormalizeFasta
 CollectMultipleMetrics      PositionBasedDownsampleSam
 CollectOxoGMetrics        QualityScoreDistribution
 CollectQualityYieldMetrics    RenameSampleInVcf
 CollectRawWgsMetrics       ReorderSam
 CollectRnaSeqMetrics       ReplaceSamHeader
 CollectRrbsMetrics        RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics RevertSam
 CollectTargetedPcrMetrics     SamFormatConverter
 CollectVariantCallingMetrics   SamToFastq
 CollectWgsMetrics         ScatterIntervalsByNs
 CompareMetrics          SortSam
 CompareSAMs            SortVcf
 ConvertSequencingArtifactToOxoG  SplitSamByLibrary
 CreateSequenceDictionary     SplitVcfs
 DownsampleSam           UpdateVcfSequenceDictionary
 EstimateLibraryComplexity     ValidateSamFile
 ExtractIlluminaBarcodes      VcfFormatConverter
 ExtractSequences         VcfToIntervalList
 FastqToSam            ViewSam
Qiime
Kvantitativ indsigt i mikrobiel økologi
Versions of package qiime
ReleaseVersionArchitectures
wheezy1.4.0-2amd64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie1.4.0-2s390
sid1.7.0+dfsg-1s390
jessie1.8.0+dfsg-4amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.8.0+dfsg-4sparc
sid1.9.1+dfsg-1amd64,arm64,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Debtags of package qiime:
roleprogram
Popcon: 13 users (3 upd.)*
Versions and Archs
License: DFSG free
Svn

QIIME (kanonisk udtalt »Chime«) er en datakanal til at udføre mikrobiel samfundsanalyse, der integrerer mange tredjepartsværktøjer, som er blevet standard på området. En standard QIIME-analyse begynder med sekvensdata fra en eller flere sekventeringsplatforme, herunder

 • Sanger,
 • Roche/454, og
 • Illumina GAIIx. QIIME kan udføre:

 • biblioteks de-multiplexing og kvalitetsfiltrering

 • fjernelse af støj med PyroNoise
 • OTU og repræsentativt sætvalg med uclust, cdhit, mothur, BLAST, eller andre værktøjer
 • taksonomisammenligning med BLAST- eller RDP-klassificeringen
 • sekvenssammenligning med PyNAST, muskel, infernalsk, eller andre værktøjer
 • rekonstruktion af fylogeni med FastTree, raxml, skarpskåret, eller andre værktøjer
 • alfa-diversitet og rarefaction, herunder visualisering af resultater, ved hjælp af over 20 målinger herunder fylogenetisk mangfoldighed, chao1 og observerede arter
 • betadiversitet og rarefaction, herunder visualisering af resultater, ved hjælp af over 25 målinger, herunder vægtet og uvægtet UniFrac, euklidisk afstand og Bray-Curtis
 • sammendrag og visualisering af taksonomiske sammensætning af prøver via cirkeldiagrammer og histogrammer og mange andre funktioner.

QIIME omfatter paralleliseringsfunktioner til mange af de beregningsintensive trin. Som standard er disse konfigureret til at udnytte et miljø med flere kerner, og er let at konfigurere til at køre i et klyngemiljø. QIIME er bygget i Python via PyCogent-værktøjssættet. Det gør udstrakt brug af enhedstest, og er yderst modulært for at lette brugerdefinerede analyser.

Please cite: J Gregory Caporaso, Justin Kuczynski, Stombaugh Jesse, Bittinger Kyle, Bushman Frederic D, Costello Elizabeth K, Fierer Noah, Pena Antonio Gonzalez, Goodrich Julia K, Gordon Jeffrey I, Huttley Gavin A, Kelley Scott T, Knights Dan, Koenig Jeremy E, Ley Ruth E, Lozupone Catherine A, McDonald Daniel, Muegge Brian D, Pirrung Meg, Reeder Jens, Sevinsky Joel R, Turnbaugh Peter J, Walters William A, Widmann Jeremy, Yatsunenko Tanya, Zaneveld Jesse and Knight Rob: QIIME allows analysis of high-throughput community sequencing data. (PubMed) Nature Methods 7:335 - 336 (2010)
R-bioc-edger
Empirisk analyse af digitale gen-udtryksdata i R
Versions of package r-bioc-edger
ReleaseVersionArchitectures
wheezy2.6.1~dfsg-1all
jessie3.2.4~dfsg-1s390
sid3.2.4~dfsg-1s390
jessie3.4.2+dfsg-2ia64,sparc
sid3.4.2+dfsg-2ia64
jessie3.8.2+dfsg-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x
sid3.10.2+dfsg-1sparc
stretch3.12.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid3.12.0+dfsg-1amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Popcon: 22 users (14 upd.)*
Versions and Archs
License: DFSG free
Git

Biokonduktor-pakke til differentieret udtryksanalyse af hel transskriptom- sekventering (RNA-seq) og digitale gen-udtryksprofiler med biologisk replikation. Det bruger empirisk Bayes-estimering og præcise test baseret på den negative binomial-fordelingsdistribution. Det er også nyttigt for differentieret signal-analyse med andre typer optællinger af genom-skala.

Please cite: Mark D. Robinson, Davis J. McCarthy and Gordon K. Smyth: edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. (PubMed,eprint) Bioinformatics 26,:139-140 (2010)
R-bioc-hilbertvis
GNU R-pakke til at visualisere lange vektordata
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
squeeze1.5.0-2amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy1.14.0-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie1.18.0-1ia64,s390,sparc
sid1.18.0-1ia64,s390
jessie1.24.0-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.26.0-1sparc
stretch1.28.0-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.28.0-1amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 23 users (14 upd.)*
Versions and Archs
License: DFSG free
Svn

Dette værktøj giver dig mulighed for at vise meget lange datavektorer på en pladseffektiv måde, ved at organisere dataene via en 2D-Hilbertkurve. Brugeren kan så visuelt bedømme den store skalastruktur og distribution af funktioner på samme tid via den rå form og intensiteten for individuelle funktioner.

I bioinformatics er et typisk brugstilfælde ChIP-Chip og ChIP-Seq, eller grundlæggende alle slags genomdata, som passende vises som kvantitative spor (»wiggle data«) i genombrowsere såsom dem tilbudt af Ensembl eller UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Samtools
Forarbejdning af sekvensopstillinger i SAM- og BAM-formater
Versions of package samtools
ReleaseVersionArchitectures
squeeze0.1.8-1amd64,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
wheezy0.1.18-1amd64,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
jessie0.1.19-1amd64,arm64,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390,s390x
sid0.1.19-1ia64,s390
stretch1.3-1amd64,arm64,armel,i386,mipsel,ppc64el
sid1.3-1amd64,arm64,armel,i386,kfreebsd-amd64,kfreebsd-i386,mips64el,mipsel,ppc64el
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 108 users (34 upd.)*
Versions and Archs
License: DFSG free
Git

Samtools er et sæt af værktøjer, der manipulerer sammenligninger af nukleotidsekvenser i det binære BAM-format. Værkøjet importerer fra og eksporterer til ascii SAM-formatet (sekvenssammenligning/map), udfører sortering, sammenlægning og indeksering, og gør det muligt at hente læsninger i alle områder hurtigt. Det er designet til at arbejde på en strøm, og er i stand til at åbne en BAM-fil (ikke SAM) på en ekstern FTP- eller HTTP-server.

The package is enhanced by the following packages: libbio-samtools-perl
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Screenshots of package samtools
Sra-toolkit
utilities for the NCBI Sequence Read Archive
Versions of package sra-toolkit
ReleaseVersionArchitectures
wheezy2.1.7a-1amd64,i386,kfreebsd-amd64,kfreebsd-i386
jessie2.3.5-2+dfsg-1amd64,i386,kfreebsd-amd64,kfreebsd-i386
stretch2.3.5-2+dfsg-1amd64,i386
sid2.3.5-2+dfsg-1amd64,i386,kfreebsd-amd64,kfreebsd-i386
Popcon: 19 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Tools for reading the SRA archive, generally by converting individual runs into some commonly used format such as fastq.

The textual dumpers "sra-dump" and "vdb-dump" are provided in this release as an aid in visual inspection. It is likely that their actual output formatting will be changed in the near future to a stricter, more formalized representation[s]. PLEASE DO NOT RELY UPON THE OUTPUT FORMAT SEEN IN THIS RELEASE.

The "help" information will be improved in near future releases, and the tool options will become standardized across the set. More documentation will also be provided documentation on the NCBI web site.

Tool options may change in the next release. Version 1 tool options will remain supported wherever possible in order to preserve operation of any existing scripts.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Ssake
Genomprogram for samling af millioner af meget korte DNA-sekvenser
Versions of package ssake
ReleaseVersionArchitectures
squeeze3.5-1all
wheezy3.8-2all
jessie3.8-2all
sid3.8-2all
jessie3.8.1-1all
sid3.8.1-1all
jessie3.8.2-1all
sid3.8.3-1all
stretch3.8.4-1all
sid3.8.4-1all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 12 users (5 upd.)*
Versions and Archs
License: DFSG free
Svn

Short Sequence Assembly af K-mer search and 3′ read Extension (SSAKE) er et genomprogram for aggressiv samling af millioner af korte nukleotidsekvenser ved gradvis at søge efter perfekte 3'-meste k-merer ved hjælp af et DNA-præfikstræ. SSAKE er designet til at hjælpe med at udnytte oplysningerne fra korte sekvenser læst ved stringent klyngeopbygning i contig'er, der kan bruges til at karakterisere nye sekventeringsmål.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Tabix
Generisk indeksprogram for TAB-afgrænsede arvemassepositionsfiler
Versions of package tabix
ReleaseVersionArchitectures
wheezy0.2.6-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.2.6-1s390
sid0.2.6-1s390
jessie0.2.6-2armhf,ia64,mips,powerpc,s390x,sparc
sid0.2.6-2ia64,sparc
jessie1.1-1amd64,arm64,armel,i386,kfreebsd-amd64,kfreebsd-i386,mipsel,ppc64el
stretch1.3-2amd64,arm64,armel,i386,mipsel,ppc64el
sid1.3-2amd64,arm64,armel,i386,kfreebsd-amd64,kfreebsd-i386,mips64el,mipsel,ppc64el
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 22 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Tabix indekserer filer hvor nogle kolonner indikerer sekvenskoordinater: navn (normalt et kromosom), start og stop. Inddatafilen skal være positionssorteret og komprimeret af bgzip (tilbudt i denne pakke), som har en grænseflade der ligner gzip. Efter indeksering er tabix i stand til hurtigt at hente datalinjer efter kromosomkoordinater. Hurtig dataindhentelse fungerer også over netværk hvis en URI angives som et filnavn.

Denne version af tabix er bygget fra HTSlib-kilden.

Screenshots of package tabix
Tophat
fast splice junction mapper for RNA-Seq reads
Versions of package tophat
ReleaseVersionArchitectures
jessie2.0.9-1s390
sid2.0.9-1s390
sid2.0.10-1ia64
jessie2.0.13+dfsg-1amd64,kfreebsd-amd64
stretch2.1.1+dfsg-1amd64
sid2.1.1+dfsg-1amd64,kfreebsd-amd64
Popcon: 16 users (18 upd.)*
Versions and Archs
License: DFSG free
Git

TopHat aligns RNA-Seq reads to mammalian-sized genomes using the ultra high-throughput short read aligner Bowtie, and then analyzes the mapping results to identify splice junctions between exons. TopHat is a collaborative effort between the University of Maryland Center for Bioinformatics and Computational Biology and the University of California, Berkeley Departments of Mathematics and Molecular and Cell Biology.

The package is enhanced by the following packages: cufflinks
Please cite: Cole Trapnell, Lior Pachter and Steven L. Salzberg: TopHat: discovering splice junctions with RNA-Seq. (PubMed,eprint) Bioinformatics 25(9):1105-1111 (2009)
Uc-echo
Fejlkorrektionsalgoritme designet for kort-læsninger fra NGS
Versions of package uc-echo
ReleaseVersionArchitectures
jessie1.12-1s390
sid1.12-1s390
jessie1.12-3ia64
sid1.12-4ia64
jessie1.12-6sparc
jessie1.12-7amd64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x
stretch1.12-9amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.12-9amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x,sparc
Popcon: 10 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ECHO er en algoritme til fejlkorrektioner designet for kort-læsninger fra næstegenerations sekvensplatforme såsom Illuninas Genome Analyzer II. Algoritmen bruger en bayesiansk ramme til at forbedre kvaliteten af læsningerne i et givent datasæt ved at anvende maksimal a posteriori-estimering.

Please cite: W.-C. Kao, A.H. Chan and Y.S. Song: ECHO: A reference-free short-read error correction algorithm. (PubMed,eprint) Genome Research 21:1181-1192 (2011)
Vcftools
Samling af værktøjer til arbejdet med VCF-filer
Versions of package vcftools
ReleaseVersionArchitectures
wheezy0.1.9-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.1.11+dfsg-1ia64,s390
sid0.1.11+dfsg-1ia64,s390
jessie0.1.12+dfsg-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x,sparc
sid0.1.12+dfsg-1sparc
stretch0.1.14+dfsg-2amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid0.1.14+dfsg-2amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Debtags of package vcftools:
roleprogram
Popcon: 26 users (8 upd.)*
Versions and Archs
License: DFSG free
Svn

VCFtools er en programpakke designet for arbejde med VCF-filer, såsom dem oprettet af 1000 Genomes Project. Formålet med VCFtools er at tilbyde metoder for arbejde med VCF-filer: validering, sammenføjning, sammenligning og beregning af noget grundlæggende statistik om befolkningsgenetik.

Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Velvet
Sekvens-assembler for nukleinsyre til meget korte læsninger
Versions of package velvet
ReleaseVersionArchitectures
squeeze1.0.02~nozlibcopy-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy1.2.03~nozlibcopy-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie1.2.10+dfsg-1ia64,s390,sparc
sid1.2.10+dfsg-1ia64,s390
jessie1.2.10+dfsg1-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.2.10+dfsg1-2sparc
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.2.10+dfsg1-3amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,powerpc,ppc64el,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 14 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet er en »de novo«-genomisk assembler som er specielt designet for teknologier til kort læsning, såsom Solexa eller 454, udviklet af Daniel Zerbino og Ewan Birney ved European Bioinformatics Institue (EMBL-EBI), nær Cambridge, i Storbritannien.

Velvet kan i øjeblikket tage korte læsesekvenser, fjerner fejl og fremstiller dernæst unikke »contig'er« i høj kvalitet. Det anvender derefter parvis læseinformation, hvis tilgængelig, til at indhente de gentagne områder mellem contig'erne.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)

Debian packages in contrib or non-free

Cufflinks
Transcript assembly, differential expression and regulation for RNA-Seq
Versions of package cufflinks
ReleaseVersionArchitectures
wheezy1.3.0-2 (non-free)amd64
jessie2.2.1-1 (non-free)amd64
sid2.2.1-1 (non-free)amd64
Popcon: 6 users (2 upd.)*
Versions and Archs
License: non-free
Git

Cufflinks assembles transcripts, estimates their abundances, and tests for differential expression and regulation in RNA-Seq samples. It accepts aligned RNA-Seq reads and assembles the alignments into a parsimonious set of transcripts. Cufflinks then estimates the relative abundances of these transcripts based on how many reads support each one.

Please cite: Cole Trapnell, Brian A Williams, Geo Pertea, Ali Mortazavi, Gordon Kwan, Marijke J van Baren, Steven L Salzberg, Barbara J Wold and Lior Pachter: Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. (PubMed) Nature Biotechnology 28(5):511-515 (2010)

Packaging has started and developers might try the packaging code in VCS

Mosaik-aligner
reference-guided aligner for next-generation sequencing
License: MIT
Debian package not available
Svn
Version: 1.1.0021-1

MosaikBuild converts various sequence formats into Mosaik’s native read format. MosaikAligner pairwise aligns each read to a specified series of reference sequences. MosaikSort resolves paired-end reads and sorts the alignments by the reference sequence coordinates. Finally, MosaikText converts alignments to different text-based formats.

At this time, the workflow consists of supplying sequences in FASTA, FASTQ, Illumina Bustard & Gerald, or SRF file formats and producing results in the BLAT axt, the BAM/SAM, the UCSC Genome Browser bed, or the Illumina ELAND formats.

No known packages available

Annovar
annotate genetic variants detected from diverse genomes
License: Open Source for non-profit
Debian package not available

ANNOVAR is an efficient software tool to utilize update-to-date information to functionally annotate genetic variants detected from diverse genomes (including human genome hg18, hg19, as well as mouse, worm, fly, yeast and many others). Given a list of variants with chromosome, start position, end position, reference nucleotide and observed nucleotides, ANNOVAR can perform:

 1. Gene-based annotation: identify whether SNPs or CNVs cause protein coding
  changes and the amino acids that are affected. Users can flexibly use RefSeq
  genes, UCSC genes, ENSEMBL genes, GENCODE genes, or many other gene definition
  systems.
 2. Region-based annotations: identify variants in specific genomic regions,
  for example, conserved regions among 44 species, predicted transcription
  factor binding sites, segmental duplication regions, GWAS hits, database
  of genomic variants, DNAse I hypersensitivity sites, ENCODE
  H3K4Me1/H3K4Me3/H3K27Ac/CTCF sites, ChIP-Seq peaks, RNA-Seq peaks, or many
  other annotations on genomic intervals.
 3. Filter-based annotation: identify variants that are reported in dbSNP,
  or identify the subset of common SNPs (MAF>1%) in the 1000 Genome Project,
  or identify subset of non-synonymous SNPs with SIFT score>0.05, or many
  other annotations on specific mutations.
 4. Other functionalities: Retrieve the nucleotide sequence in any
  user-specific genomic positions in batch, identify a candidate gene list
  for Mendelian diseases from exome data, identify a list of SNPs from
  1000 Genomes that are in strong LD with a GWAS hit, and many other
  creative utilities.

In a modern desktop computer (3GHz Intel Xeon CPU, 8Gb memory), for 4.7 million variants, ANNOVAR requires ~4 minutes to perform gene-based functional annotation, or ~15 minutes to perform stepwise "variants reduction" procedure, making it practical to handle hundreds of human genomes in a day.

Forge
genome assembler for mixed read types
License: Apache 2.0
Debian package not available

Forge Genome Assembler is a parallel, MPI based genome assembler for mixed read types.

Forge is a classic "Overlap layout consensus" genome assembler written by Darren Platt and Dirk Evers. Implemented in C++ and using the parallel MPI library, it runs on one or more machines in a network and can scale to very large numbers of reads provided there is enough collective memory on the machines used. It generates a full consensus alignment of all reads, can handle mixtures of sanger, 454 and illumina reads. There is some support for solid color space and it includes built in tools for vector trimming and contamination screening.

Forge and was originally developed at Exelixis and they have kindly agreed to place the software which underwent much subsequent development outside Exelixis, into the public domain. Forge works with most of the common MPI implementations.

Remark of Debian Med team: Competitor to MIRA2 and wgs-assembler

This package was requested by William Spooner whs@eaglegenomics.com as a competitor to MIRA2 and wgs-assembler.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 193664