Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Next Generation Sequencing
Debian Med bioinformatics applications usable in Next Generation Sequencing

It aims at gettting packages which specialize in the processing or interpretation of data generated with next- (and later-) generation high-thoughput sequencing technologies.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Next Generation Sequencing packages

Official Debian packages with high relevance

anfo
Short Read Aligner/Mapper fra MPG
Versions of package anfo
ReleaseVersionArchitectures
buster0.98-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.98-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie0.98-4amd64,armel,armhf,i386
bullseye0.98-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.98-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Anfo er en mapper i stil med Soap/Maq/Bowtie, men dets implementering har arvet mere fra BLAST/BLAT. Det er mest nyttig for sammenligning af sekvenslæsninger hvor DNA-sekvensen er ændret en smule (tænk ældre DNA eller bisulfit behandling) og/eller der er større forskel mellem prøve og reference end hvad hurtige mappere vil håndtere pænt (lad os sige at referencearvemassen mangler og en tæt forbundet art bruges i stedet for).

Registry entries: SciCrunch 
Topics: Sequencing
arden
Specificitetskontrol for læse sammenligninger ved anvendelse af en kunstig reference
Versions of package arden
ReleaseVersionArchitectures
buster1.0-4all
trixie1.0-5all
bookworm1.0-5all
bullseye1.0-5all
stretch1.0-3all
jessie1.0-1amd64,armel,armhf,i386
sid1.0-5all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

ARDEN (Artificial Reference Driven Estimation of false positives in NGS data) er en begyndende sammenligning (benchmark), der estimerer fejlprocenter baseret på virkelige eksperimentelle læsninger og en yderligere genereret kunstig referencearvemasse. Det giver mulighed for beregning af fejlprocenter specifikke for et datasæt og konstruktion af en ROC-kurve. Derved kan det bruges til at optimere parametre for læste kortlæggere, til at vælge læsningsoversættere for et specifikt problem eller også til at filtrere sammenligninger baseret på kvalitetsskøn.

Please cite: Sven H. Giese, Franziska Zickmann and Bernhard Y. Renard: Specificity control for read alignments using an artificial reference genome-guided false discovery rate. (PubMed,eprint) Bioinformatics 30(1):9-16 (2013)
Registry entries: SciCrunch 
Topics: Sequencing
art-nextgen-simulation-tools
Simuleringsværktøjer til at oprette syntetiske næstegenerationssekventeringslæsninger
Versions of package art-nextgen-simulation-tools
ReleaseVersionArchitectures
sid20160605+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm20160605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye20160605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch20160605+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster20160605+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie20160605+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

ART er et sæt af simuleringsværktøjer til at oprette syntetiske næstegenerationssekventeringslæsninger. ART simulerer sekventeringslæsninger ved at efterligne virkelige sekventeringsprocesser med empiriske fejlmodeller eller kvalitetsprofiler opsummeret fra store justerede sekventeringsdata. ART kan også simulere læsninger via en brugerejet læsefejlmodel eller kvalitetsprofiler. ART understøtter simulering af single-end, parret ende/mate-pair-læsninger fra tre store kommercielle næstegenerationssekventeringsplatforme: Illuminas Solexa, Roches 454 og Applied Biosystems SOLID. ART kan bruges til at teste eller sammenligne en række metoder eller værktøjer til næstegenerationssekventeringsdataanalyse, herunder læsejustering, de novo-samling, SNP- og variationsstrukturregistrering. ART blev brugt som et primært værktøj til simuleringsundersøgelse af de 1.000 genomer projekt. ART er implementeret i C ++ med optimerede algoritmer og er yderst effektiv i læsningssimulering. ART udsender læsninger i FASTQ-format, og sammenligninger i ALN-format. ART kan også oprette linjeføringer i SAM-sammenligning eller UCSC BED-filformatet. Teknikken, kan anvendes sammen med genomvariantsimulatorer (f.eks. VarSim) til evaluering af variantkaldværktøjer eller -metoder.

Please cite: Weichun Huang, Leping Li, Jason R. Myers and Gabor T. Marth: ART: a next-generation sequencing read simulator. (PubMed,eprint) Bioinformatics 28(4):593-594 (2012)
Registry entries: SciCrunch  Bioconda 
artfastqgenerator
Viser kunstige FASTQ-filer afledt fra et referencegenom
Versions of package artfastqgenerator
ReleaseVersionArchitectures
bookworm0.0.20150519-4all
trixie0.0.20150519-5all
sid0.0.20150519-5all
stretch0.0.20150519-2all
buster0.0.20150519-3all
bullseye0.0.20150519-4all
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

ArtificialFastqGenerator anvender referencegenomet (i FASTA-format) som inddata og fremstiller kunstige FASTQ-filer i formatet Sanger. Programmet kan acceptere Phred base-kvalitetsbedømmelser fra eksisterende FASTQ-filer og bruge dem til at simulere sekvensfejl. Da de kunstige FASTQ'er er afledt fra referencegenomet, tilbyder referencegenomet en guldstandard for kald af varianter (Single Nucleotide Polymorphisms (SNP'er) og indsættelser og sletninger (indels)). Dette aktiverer evaluering af en Next Generation Sequencing-analysekanal (NGS) som sammenligner læsninger med referencegenomet og så kalder varianterne.

Please cite: Matthew Frampton and Richard Houlston: Generation of Artificial FASTQ Files to Evaluate the Performance of Next-Generation Sequencing Pipelines. (PubMed,eprint) PLOSone 7(11):e49110 (2012)
bamtools
Værktøjssæt for manipulering af BAM-filer - sammenligning af arvemasser
Versions of package bamtools
ReleaseVersionArchitectures
jessie2.3.0+dfsg-2amd64,armel,armhf,i386
buster2.5.1+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.5.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.4.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 11 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

BamTools faciliterer forskningsanalyse og datahåndtering med brug af BAM-filer. Værktøjet håndterer de enorme datamængder lavet af nuværende sekvensteknologier, som typisk lagres i komprimerede, binære formater, som ikke nemt håndteres af tekstbaserede fortolkere ofte brugt i forskning indenfor bioinformatik.

BamTools tilbyder både en C++-API for BAM-filunderstøttelse samt et værktøjssæt for kommandolinjen.

Dette er værktøjssættet til kommandolinjen for bamtools.

Tilgængelige kommandoer for bamtools:

 convert  Konverterer mellem BAM og et antal andre formater
 count    Udskriver antallet af sammenligninger i BAM-filer
 coverage Udskriver dækningsstatistik fra inddata-BAM-filen
 filter   Filtrerer BAM-filer efter kriterier angivet af brugeren
 header   Udskriver BAM-teksthovedinformation
 index    Opretter indeks for BAM-fil
 merge    Sammenføj flere BAM-filer til en enkel fil
 random   Vælg vilkårlige sammenligninger fra eksisterende BAM-filer,
          lavet mere som et testværktøj.
 resolve  Slår parret ende-læsninger op (markerer IsProperPair-flaget
          efter behov)
 revert   Fjerner duplikerede mærker og gendanner originale
          basiskvaliteter
 sort     Sorterer BAM-filen jævnfør nogle kriterier
 split    Deler en BAM-fil på brugerangivne egenskab, opretter en ny
          BAM-uddatafil for hver fundet værdi
 stats    Udskriver lidt grundlæggende statistik fra inddata-BAM-filer
The package is enhanced by the following packages: multiqc
Please cite: Derek W. Barnett, Erik K. Garrison, Aaron R. Quinlan, Michael P. Stromberg and Gabor T. Marth: BamTools: a C++ API and toolkit for analyzing and managing BAM files. (PubMed,eprint) Bioinformatics 27(12):1691-2 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bcftools
Genomisk variantkald og manipulering af VCF/BCF-filer
Versions of package bcftools
ReleaseVersionArchitectures
bookworm1.16-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie1.19-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid1.19-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
stretch1.3.1-1amd64,arm64,armel,mips64el,mipsel,ppc64el
stretch-backports1.8-1~bpo9+1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
buster1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
Popcon: 27 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

BCFtools er et sæt af redskaber, som manipulerer variantkald i Variant Call Format (VCF) og dets binære modpart BCF. Alle kommandoer fungerer gennemsigtigt med både VCF'er og BCF'er, både uden komprimering og komprimeret med BGZF.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek and Shane A. McCarthy: BCFtools/csq: Haplotype-aware variant consequences. (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bedtools
Programpakke med redskaber for sammenligning af arvemassefunktioner
Versions of package bedtools
ReleaseVersionArchitectures
jessie2.21.0-1amd64,armhf,i386
bookworm2.30.0+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.30.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
buster2.27.1+dfsg-4amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
trixie2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 49 users (15 upd.)*
Versions and Archs
License: DFSG free
Git

BEDTools-redskaber giver mulighed for at adressere gængse arvemasseopgaver såsom at finde funktionsoverlap og beregne dækning. Redskaberne er hovedsagelig baseret på fire meget udbredte filformater: BED, GFF/GTF, VCF og SAM/BAM. Med brug af BEDTools kan du udvikle sofistikerede datakanaler, som besvarer komplicerede forskningsspørgsmål ved at udsende flere BEDTools sammen.

Redskabet groupBy er distribueret i pakken filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
berkeley-express
Strømkvantificering til sekventering med høj gennemløb
Versions of package berkeley-express
ReleaseVersionArchitectures
bullseye1.5.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.5.2+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.5.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

EXpress er et strømværktøj til kvantificering af mængderne af et sæt målrettet sekvenser fra stikprøveundersekvenser. Eksempler på programmer omfatter transkript-plan RNA-Seq-kvantificering, allele-specifik/haplotype udtryksanalyse (fra RNA-Seq), transskriptionsfaktorbindende kvantificering chip-Seq, og analyse af metagenomisk data. Det er baseret på en net-EM algoritme, der resulterer i rumkrav (hukommelse) proportionale med den samlede størrelse af målsekvenser og tidskrav, der er proportionale med antallet af stikprøvefragmenter. I programmer såsom RNA-Seq kan eXpress udtryk nøjagtigt kvantificere meget større prøver end andre aktuelt tilgængelige værktøjer, hvilket reducerer beregningskrav til infrastruktur. EXpress kan bruges til at opbygge lette sekventerende behandlingsdatakanaler med høj gennemløb, når kombineret med en strømudjævner (såsom Bowtie), da uddata kan ledes direkte ind i eXpress, hvilket effektivt fjerner behovet for at gemme læsningstilpasninger i hukommelsen eller på disken.

I en analyse af resultaterne af Express til RNA-Seq data, var det observeret, at denne effektivitet ikke kommer på en bekostning af præcision. EXpress er mere præcis end andre tilgængelige værktøjer, selv når begrænset til mindre datasæt, der ikke kræver en sådan effektivitet. Desuden, ligesom Cufflinks-programmet, kan udtrykket bruges til at estimere udskriftsmængderne i multi-isoform-gener. EXpress er også i stand til at løse flerkortlægninger af læsninger på tværs af genfamilier, og kræver ikke en henvisning til genomet således at det kan anvendes i forbindelse med de novo-montører såsom Trinity, Oaser eller Trans-afgrunden. Den underliggende model er baseret på tidligere beskrevne sandsynlighedsmodeller udviklet for RNA-Seq men kan anvendes til andre miljøer, hvor stikprøvemålsekvenserne, og indeholder parametre for længdefragmentdistributioner, fejl i læsninger, og sekvens-specifik fragmentbias.

EXpress kan bruges til at løse tvetydige tilknytninger i andre sekventeringsbaserede programmer med høj gennemløb. Det eneste, der kræves af inddata er at udtrykke et sæt af målsekvenser og et sæt af sekventerede fragmenter multiply-aligned for dem. Mens disse målsekvenser ofte vil være gen-isoformer, behøver de ikke at være det. Haplotyper kan anvendes som referencepriser for allele-specifik udtryksanalyse, bindende regioner for Chip-Seq, eller målgenomer i metagenomet-eksperimenter. EXpress er anvendelige i analyser, hvor der læses multi-kort til sekvenser, der afviger i stor grad.

Please cite: Adam Roberts and Lior Pachter: Streaming fragment assignment for real-time analysis of sequencing experiments. (PubMed) Nature Methods 10(1):71–73 (2013)
Registry entries: SciCrunch  Bioconda 
bio-rainbow
Klyngeopsætning og samling af korte læsninger for bioinformatik
Versions of package bio-rainbow
ReleaseVersionArchitectures
trixie2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.0.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Effektivt værktøj for klyngeopsætning og samling af korte læsninger, specielt for RAD.

Rainbow er udviklet for at tilbyde en ultra hurtig og hukommelseseffektiv løsning til klyngeopbygning og samling af korte læsninger fremstillet af RAD-seq. Først læser Rainbowklynger via en »spaced seed«-metode. Derefter implementerer Rainbow en heterozygot kaldelignende strategi til at opdele potentielle grupper i haplotyper i en op-nedad metode. Langs et guidet træ sammenføjes interaktivt underblade i en bund-op metode, hvis de har nok lighed.

Her er ligheden defineret ved at sammenligne den 2. læsning af et RAD-segment. Denne fremgangsmåde forsøger at samle heterozygot, mens gentagende sekvenser diskrimineres. Til sidste bruger Rainbow en grådig algoritme til lokalt at samle sammenføjede læsninger i contig'er. Rainbow viser ikke kun den optimale men også mindre optimale samlingsresultater. Baseret på simulering og reelle guppy RAD-seq-data, er det vist at Rainbow er mere kompetent end andre værktøjer i håndteringen af RAD-seq-data.

Please cite: Zechen Chong, Jue Ruan and Chung-I. Wu: Rainbow: an integrated tool for efficient clustering and assembling RAD-seq reads.. (PubMed) Bioinformatics 28(21):2732-2737 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
blasr
Kortlægning af enkelte molekylesekventeringslæsninger
Versions of package blasr
ReleaseVersionArchitectures
stretch5.3+0-1amd64,arm64,mips64el,ppc64el
sid5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64
trixie5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el
bookworm5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el
bullseye5.3.3+dfsg-5amd64,arm64,mips64el,ppc64el
buster5.3.2+dfsg-1.1amd64,arm64,mips64el,ppc64el
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Grundlæggende lokal opsætning med successiv raffinement (BLASR) er en metode til kortlægning af enkelte molekylesekventeringslæsninger mod et referencegenom. En sådan læsning er tusindvis af baser lang, med divergens mellem dem og genomet bliver domineret af indsættelses- og slettefejl.

Registry entries: Bio.tools  SciCrunch  Bioconda 
bowtie
Ultrahurtig og hukommelseseffektiv short read-sammenligner
Versions of package bowtie
ReleaseVersionArchitectures
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
bullseye1.3.0+dfsg1-1amd64,arm64,mips64el,ppc64el,s390x
buster1.2.2+dfsg-4amd64,arm64,mips64el,ppc64el,s390x
bookworm1.3.1-1amd64,arm64,mips64el,ppc64el,s390x
trixie1.3.1-3amd64,arm64,mips64el,ppc64el,s390x
sid1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie1.1.1-2amd64
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 40 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Denne pakke adresserer problemet med at fortolke resultaterne fra de seneste (2010) DNA-sekvensteknologier. Disse vil resultere i ret så korte stræk og disse kan ikke fortolkes direkte. Det er udfordringen for værktøjer såsom Bowtie at give en kromosonplacering til korte stræk af DNA sekventeret per kørsel.

Bowtie sammenligner korte DNA-sekvenser (læsninger) for den menneskelige arvemasse med en hastighed på mere end 25 millioner 35-bp læsninger per time. Bowtie indekserer arvemassen med et Burrows-Wheeler-indeks for at holde hukommelsesaftrykket lavt: Typisk omkring 2,2 GB for den menneskelige arvemasse (2,9 GB for paired-end).

The package is enhanced by the following packages: bowtie-examples multiqc
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
bowtie2
Ultrahurtig og hukommelseseffektiv short read-sammenligner
Versions of package bowtie2
ReleaseVersionArchitectures
buster2.3.4.3-1amd64
trixie2.5.2-1amd64,arm64,mips64el,ppc64el
sid2.5.2-1amd64,arm64,mips64el,ppc64el,riscv64
bullseye2.4.2-2amd64,arm64,mips64el,ppc64el
jessie2.2.4-1amd64
bookworm2.5.0-3amd64,arm64,mips64el,ppc64el
stretch2.3.0-2amd64
upstream2.5.3
Popcon: 31 users (9 upd.)*
Newer upstream!
License: DFSG free
Git

Bowtie 2 er et ultrahurtigt og hukommelseseffektivt værktøj til sammenligning af sekventeringslæsninger til lange referencesekvenser. Det er især velegnet til at justere læsninger fra omkring 50'erne op til 100'erne eller tusindvis af tegn, og særligt velegnet til at tilpasse til relativt lange (f.eks pattedyrs) arvemasser.

Bowtie 2 indekserer arvemassen med et FM-indeks til at holde sin hukommelsesaftryk lavt: for den menneskelige arvemasse er dets hukommelsesaftryk typisk omkring 3,2 GB. Bowtie 2 understøtter tilpasningstilstande for gapped, lokale og parret ende (paired-end).

The package is enhanced by the following packages: bowtie2-examples multiqc
Please cite: Ben Langmead and Steven L Salzberg: Fast gapped-read alignment with Bowtie 2. (PubMed) Nature Methods 9:357–359 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
bwa
Burrows-Wheeler Aligner (sekvenssammenligner)
Versions of package bwa
ReleaseVersionArchitectures
trixie0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
experimental0.7.17-8~0expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.17-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.7.17-3amd64
stretch-backports0.7.17-1~bpo9+1amd64
stretch0.7.15-2+deb9u1amd64
jessie0.7.10-1amd64
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 31 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Burrows-Wheeler Aligner (BWA) er en programpakke, for oversættelse af lavafvigende sekvenser mod en stor referencearvemasse, såsom den menneskelige arvemasse. Den består af tre algoritmer: BWA-backtrack, BWA-SW og BWA-MEM. Den første algoritme er designet for Illunina-sekvenslæsninger op til 100 bp, mens de sidste to er for længere sekvenser fra 70 bp til 1 Mbp. BWA-MEM og BWA-SW deler funktioner såsom understøttelse af long-read og opdelingssammenligning, men BWA-MEM, som er den seneste, anbefales generelt for højkvalitets forespørgsler, da den er hurtigere og mere præcis. BWA-MEM har også bedre ydelse end BWA-backtrack for 70-100 bp Illumina-læsninger.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
canu
Enkel molekyle sekvenssamler for genomer
Versions of package canu
ReleaseVersionArchitectures
sid2.2+dfsg-5amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm2.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports1.7.1+dfsg-1~bpo9+1amd64
buster1.8+dfsg-2amd64
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Canu er en forgrening af Celera Assembler, designet for høj-støj enkel molekyle sekvensopbygning (såsom PacBio RS II eller Oxford Nanopore MinION).

Canu er en hierarkisk samlelinje, som kører i fire trin:

  • Detekter overlap i sekvenser med høj støj med MHAP
  • Opret korrigeret sekvenskonsensus
  • Trim rettede sekvenser
  • Saml trimmede rettede sekvenser
Please cite: Sergey Koren, Brian P. Walenz, Konstantin Berlin, Jason R. Miller and Adam M. Phillippy: Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation.. Genome Res. (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
changeo
Repertoire klonal assignment toolkit - Python 3
Versions of package changeo
ReleaseVersionArchitectures
buster0.4.5-1all
bookworm1.3.0-1all
sid1.3.0-1all
bullseye1.0.2-1all
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Change-O er en samling af værktøjer til at behandle resultatet fra V(D)J-sammenligningsværktøjer, tildele klonale klynger til immunglobulin-sekvenser (Ig) og genkonstruktion til germline-sekvenser.

Dramatiske forbedringer i høj-gennemløb sekvensteknologier aktiverer nu karakterisering af Ig-repertoirer i stor skala, defineret som samlingen af trans-membran antigen-receptor proteiner placeret på overfladen af B-celler og T-celler. Change-O er en pakke af redskaber til at facilitere avanceret analyse af Ig- og TCR-sekvenser, der følger germline-segmentsammenligning. Change-O håndterer resultatet fra IMGT/HighV-QUEST og IgBLAST og tilbyder en bred vifte af klyngemetoder for tildeling af klonale grupper til Ig-sekvenser. Postsortering, gruppering og diverse databasemanipuleringsoperationer er også indeholdt.

Denne pakke installerer biblioteket for Python 3.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Link to publication (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: Bioconda 
crac
Integreret RNA-Seq-læsanalyse
Versions of package crac
ReleaseVersionArchitectures
stretch2.5.0+dfsg-1amd64
bookworm2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
trixie2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el
buster2.5.0+dfsg-3amd64,arm64,mips64el,ppc64el
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

CRAC er et værktøj til at analysere High Throughput Sequencing-data (HTS) sammenlignet med et referencegenom. Er lavet for transkriptomisk og genomisk sekvenslæsninger. Mere præcist, med transkriptomiske læsninger som inddata, så forudsiges punktmutationer, indel'er, delingspunkt og chimerisk RNA'er (dvs. ikke kolinære delingspunkter). CRAC kan også vise positioner og natur for sekvensfejl som detekteres i læsningerne. CRAC bruger et genomindeks. Dette indeks skal beregnes før kørsel af læseanalysen. Til dette formål bruges kommandoen »crac-index« på dine genmofiler. Du kan så behandle læsningerne via kommandoen crac. Se manualsiden for CRAC (hjælpefilen) ved at taste »man crac«. CRAC kræver en stor mængde hukommelse på din computer. For behandling mod menneskegenomer, f.eks. for 50 millioner læsninger med 100 nukleotider hver kræver CRAC omkring 40 gigabyte hovedhukommelse. Kontroller, om systemet for din beregningsserver er udstyret med tilstrækkelig mængde hukommelsen, før start af en analyse.

Please cite: Eliseos J. Mucaki, Natasha G. Caminsky, Ami M. Perri, Ruipeng Lu, Alain Laederach, Matthew Halvorsen, Joan H. M. Knoll and Peter K. Rogan: A unified analytic framework for prioritization of non-coding variants of uncertain significance in heritable breast and ovarian cancer. (PubMed) BMS Medical Genomics 9:19 (2016)
Registry entries: Bio.tools  SciCrunch 
cutadapt
Rens biologiske sekvenser fra sekvenslæsninger med høj gennemløb
Versions of package cutadapt
ReleaseVersionArchitectures
stretch1.12-2all
buster1.18-1all
bookworm4.2-1all
trixie4.4-1all
sid4.4-1all
bullseye3.2-2all
upstream4.6
Popcon: 15 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Cutadapt hjælper med biologisk sekvensrensningsopgaver ved at finde adapter- eller primer-sekvenserne på en fejltolerant måde. Kan også ændre og filtrere læsninger på forskellige måder. Adaptersekvenser kan indeholde IUPAC-jokertegn. Også paired-end-læsninger og selv farverumsdata er understøttet. Hvis du ønsker det, så kan du også bare demultiplexe dine inddata, uden at fjerne adaptersekvenser overhovedet.

Denne pakke indeholder brugerfladen.

The package is enhanced by the following packages: multiqc
Please cite: Marcel Martin: Cutadapt removes adapter sequences from high-throughput sequencing reads. (eprint) EMBnet.journal 17(1):10-12 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
daligner
Lokal tilpasningsregistrering mellem lange nukleotidsekventeringslæsninger
Versions of package daligner
ReleaseVersionArchitectures
buster1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0+git20240119.335105d-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0+git20240119.335105d-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch1.0+20161119-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0+git20221215.bd26967-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0+git20200727.ed40ce5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Disse værktøjer gør det muligt at finde alle signifikante lokale tilpasninger mellem læsninger kodet i en Dazzler-database. Antagelsen er at læsningerne er fra en »Pacific Biosciences RS II long read sequencer«. Det vil sige, at læsningerne er lange og usikre, op til 15 % i gennemsnit.

Please cite: Gene Myers: Efficient Local Alignment Discovery amongst Noisy Long Reads. 8701:52-67 (2014)
Registry entries: SciCrunch  Bioconda 
deepnano
Alternativ basecaller for MinION-læsninger af genomsekvenser
Versions of package deepnano
ReleaseVersionArchitectures
bullseye0.0+git20170813.e8a621e-3.1amd64,arm64,armhf,i386,ppc64el,s390x
buster0.0+git20170813.e8a621e-3amd64,arm64,i386,ppc64el,s390x
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

DeepNano er en alternativ basecaller for Oxford Naopore MinION-læsninger baseret på dybe tilbagevendende neurale netværk.

I øjeblikket fungerer den med SQK-MAP-006 og SQK-MAP-005 kemi og har en efterbrænder for Metrichor.

Please cite: Vladimír Boža, Broňa Brejová and Tomáš Vinař: DeepNano: Deep recurrent neural networks for base calling in MinION nanopore reads. PLOS one (2017)
discosnp
Find enkel nukleotidpolymorfisme fra rå læsning af sæt
Versions of package discosnp
ReleaseVersionArchitectures
buster2.3.0-2amd64,arm64,i386,mips64el,ppc64el,s390x
trixie2.6.2-3amd64,arm64,mips64el,ppc64el
stretch1.2.6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.5-1amd64,armel,armhf,i386
sid2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
bullseye4.4.4-1amd64,arm64,i386,mips64el,ppc64el,s390x
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Software discoSnp er designet til at opdage Single Nukleotid Polymorfi (SNP) fra rå læsning af sæt indhentet med Next Generation Sequencers (NGS).

Bemærk at antallet af læsesæt ikke er begrænset, det kan være en, to, eller mere. Bemærk også, at ingen andre oplysninger som reference arvemasse eller anmærkninger er nødvendige.

Programmet består af to moduler. Første modul, kissnp2, detekterer SNP'er fra læst sæt. Et andet modul, kissreads, forbedrer kissnp2- resultater ved at beregne per læst sæt og for hvert fundet SNP:

 1) dets middel læsedækning
 2) (Phred) kvaliteten af læsninger oprettet af polymorfismen.

Dette program efterfølges af DiscoSnp++.

Registry entries: Bio.tools  SciCrunch  Bioconda 
dnaclust
Værktøj til klyngedannelse af korte DNA-sekvenser
Versions of package dnaclust
ReleaseVersionArchitectures
trixie3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3-2amd64,armel,armhf,i386
sid3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Dnaclust er et værktøj til klyngedannelse af et stort antal korte DNA-sekvenser. Klyngerne oprettes på en måde så »radiussen« for hver klynge ikke er større end den angivne tærskel.

Inddatasekvenserne der skal indgå i klyngedannelsen skal være i formatet Fasta. Id'en for hver sekvens er baseret på det første ord i sekvensen i formatet Fasta. Det første ord er præfikset for teksthovedet til den første forekomst af mellemrum i teksthovedet.

Please cite: Mohammadreza Ghodsi, Bo Liu and Mihai Pop: DNACLUST: accurate and efficient clustering of phylogenetic marker genes. (PubMed,eprint) BMC Bioinformatics 12:271 (2011)
Registry entries: Bio.tools  SciCrunch 
dwgsim
Simulator til kort sekventeringslæsninger
Versions of package dwgsim
ReleaseVersionArchitectures
bullseye0.1.12-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.1.11-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.1.12-2amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.1.14-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.14-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.1.14-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

DWGSIM simulerer kort sekventeringslæsninger fra moderne sekventeringsplatform. DWGSIM opretter basisfejlsatser via en parametrisk model, hvilket giver en mere realistisk fejlprofil. Programmet blev oprindelig udviklet til brug i evaluering af korte læsningsjusteringer.

Registry entries: SciCrunch  Bioconda 
ea-utils
Værktøjer til kommandolinjen for behandling af biologiske sekvensdata
Versions of package ea-utils
ReleaseVersionArchitectures
bookworm1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.2+dfsg-6amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.2+dfsg-5amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.1.2+dfsg-4amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 12 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Ea-utils tilbyder et sæt af værktøjer til kommandolinjen for behandling af biologiske sekvensdata, stregkodedemultiplexing, adaptertrimming etc.

Primært skrevet for at understøtte en Ilumina-baseret datakanal - men bør fungere med enhver FASTQ.

De vigtigste værktøjer er:

  • fastq-mcf Skanner en sekvensfil for adaptere og baseret på en logskaleret tærskel bestemmes et sæt af klippende parametre og klipningen udføres. Udfører også detektering af skævvridning og kvalitetfiltrering.

  • fast-multx Demultiplexer en fastq. Kan automatisk bestemme stregjkode-id'er baseret på et mastersætfelt. Bevarer flere læsninger i synkronisering under demultiplexing. Kan også verificere at læsninger er synkrone og fejler hvis ikke.

  • fast-join Svarer til audy' stitch-program, men i C, mere effektivt og understøtter nogle automatiske sammenligninger og indstillingsforbedringer. Den bruger den samme »kvadreret afstand til forankrede tilpasning« som andre værktøjer.

  • varcall Tager en samling og beregner varianter på en mere parameteropbygget måde end andre værktøjer.

Please cite: Erik Aronesty: Comparison of Sequencing Utility Programs. (eprint) The Open Bioinformatics Journal 7:1-8 (2013)
Registry entries: Bio.tools  SciCrunch 
fastaq
Manipuleringsværktøjer til FASTA- og FASTQ-filer
Versions of package fastaq
ReleaseVersionArchitectures
bookworm3.17.0-5all
trixie3.17.0-6all
sid3.17.0-6all
jessie1.5.0-1all
stretch3.14.0-1all
buster3.17.0-2all
bullseye3.17.0-3all
Popcon: 8 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Fastaq repræsenterer en alsidig samling af skripter, som udfører nyttige og gængse FASTA/FASTQ-manipuleringsopgaver, såsom filtrering, sammenføjning, opdeling, sortering, trimning, søg/erstat etc. Inddata- og uddatafiler kan gzippes (formatet detekteres normalt automatisk) og individuelle Fastaq-kommandoer kan kanaliseres sammen.

Topics: Bioinformatics
fastp
Ultrahurtig alt i en FASTQ-forbrænder
Versions of package fastp
ReleaseVersionArchitectures
buster0.19.6+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.20.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.23.2+dfsg-2amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
trixie0.23.4+dfsg-1amd64,arm64,armel,armhf,mips64el,ppc64el,s390x
sid0.23.4+dfsg-1amd64,arm64,armel,armhf,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Alt i en FASTQ-forbrænder, fastp tilbyder funktioner inklusive kvalitetsprofilering, adaptertilpasning, læsefiltrering og basiskorrektion. Programmet understøtter både single-end og paired-end korte læsedata og tilbyder også en grundlæggende understøttelse for long-read data.

The package is enhanced by the following packages: multiqc
Please cite: Shifu Chen, Yanqing Zhou, Yaru Chen and Jia Gu: fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics 34(17):i884-i890 (2018)
Registry entries: Bioconda 
fastqc
Kvalitetskontrol for høj gennemløb af sekvensdata
Versions of package fastqc
ReleaseVersionArchitectures
jessie0.11.2+dfsg-3all
stretch0.11.5+dfsg-6all
buster0.11.8+dfsg-2all
bullseye0.11.9+dfsg-4all
bookworm0.11.9+dfsg-6all
trixie0.12.1+dfsg-3all
sid0.12.1+dfsg-3all
Popcon: 31 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

FastQC forsøger at tilbyde en simpel måde at udføre lidt kvalitetskontrol på rå sekvensdata, der kommer fra sekvensdatakanaler med høj gennemløb. Programmet tilbyder et modulsæt af analyser, som du kan bruge til et hurtigt indtryk af om dine data har nogle problemer, som du skal være opmærksom på før du udfører yderligere analyse.

Hovedfunktionerne i FastQc er

  • Import af data fra BAM-, SAM- eller FastQ-filer (alle varianter)
  • Tilbyder et hurtigt overblik som fortæller dig i hvilke områder, der kan være problemer
  • Referatgrafer og tabeller til hurtigt at tilgå dine data
  • Eksport af resultater til en HTML-baseret permanent rapport
  • Operation uden internet til automatiseret oprettelse af rapporter uden at køre det interaktive program
The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
flexbar
Fleksibel stregkode og adapterfjernelse for sekvensplatforme
Versions of package flexbar
ReleaseVersionArchitectures
buster3.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.50-1amd64,armhf,i386
sid3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.50-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el
bullseye3.5.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Flexbar forbehandler high-throughput sekventeringsdata effektivt. Programmet demultiplekser stregkodede kørsler og fjerner adaptersekvenser. Endvidere tilbydes trimnings- og filtreringsfunktioner. Flexbar øger oversættelseshastigheder og forbedrer arvemasse- og transskriptome-samlinger. Programmet understøtter næstegeneration sekventeringsdata i fasta/q- og csfasta/q-format fra Illumina, Roche 454 og SOLID-platformen.

Parameternavne ændret i FLEXBAR. Gennemse venligst skripter. De seneste måneder, standardindstillinger blev optimeret, blev flere fejl fastsat og forskellige forbedringer blev foretaget, f.eks blev grænsefladen for kommandolinjen moderniseret, nye trimningstilstande samt lavere tids- og hukommelseskrav.

The package is enhanced by the following packages: multiqc
Please cite: Matthias Dodt, Johannes T. Roehr, Rina Ahmed and Christoph Dieterich: FLEXBAR — Flexible Barcode and Adapter Processing for Next-Generation Sequencing Platforms. (eprint) Biology 1(3):895-905 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
fml-asm
Værktøj til at samle Illuminakorte læsninger i små områder
Versions of package fml-asm
ReleaseVersionArchitectures
sid0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental0.1+git20190320.b499514-2~0expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch0.1-2amd64
stretch-backports0.1-4~bpo9+1amd64
buster0.1-5amd64
bullseye0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream0.1+git20221215.85f159e
Popcon: 4 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Fml-asm er et kommandolinjeværktøj til at samle Illuminakorte læsninger i områder fra 100bp til 10 millioner bp i størrelse, baseret på biblioteket fermi-lite. Det er hovedsagelig en mindre version i hukommelsen af fermikit uden oprettelse af nogen mellemliggende filer. Værktøjet arver ydelsen, det relative lille hukommelsesaftryk og funktionerne fra fermikit. Fermi-lite er specielt god til at bevare heterozgous-hændelser og kan derfor bruges til at samle diploide områder for variantkald.

Registry entries: Bio.tools  SciCrunch  Bioconda 
fsm-lite
Frekvensbaseret strengminering - lite
Versions of package fsm-lite
ReleaseVersionArchitectures
bookworm1.0-8amd64,arm64,mips64el,ppc64el,s390x
stretch1.0-2amd64,arm64,mips64el,ppc64el,s390x
buster1.0-3amd64,arm64,mips64el,ppc64el,s390x
bullseye1.0-5amd64,arm64,mips64el,ppc64el,s390x
trixie1.0-8amd64,arm64,mips64el,ppc64el,s390x
sid1.0-8amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

En implementering af frekvensbaseret understrengsminering for en kerne brugt i bioinformatik til at udtrække understrenge som diskriminerer to (eller flere) datasæt inden i sekvensdata med høj gennemløb.

Registry entries: SciCrunch  Bioconda 
giira
RNA-Seq-drevet gen-registrering der indarbejder tvetydige læsninger
Versions of package giira
ReleaseVersionArchitectures
jessie0.0.20140210-2amd64
stretch0.0.20140625-1amd64
buster0.0.20140625-2amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

GIIRA er en gen-forudsigelsesmetode, der identificerer potentielle kodningsregioner udelukkende baseret på kortlægning af læsninger fra et RNA-Seq-eksperiment. Det blev hovedsagelig konstrueret til prokaryotisk gen-forudsigelse og er i stand til at vise gener inden i den viste region for et operon. Det kan også bruges til eukaryoter og forudsiger exon-intron- strukturer samt alternative isoformer.

Please cite: Franziska Zickmann, Martin S. Lindner and Bernhard Y. Renard: GIIRA—RNA-Seq driven gene finding incorporating ambiguous reads. (PubMed,eprint) Bioinformatics (2013)
Registry entries: Bio.tools  SciCrunch 
grinder
Alsidige omics shotgun og amplikon sekventeringslæsningssimulator
Versions of package grinder
ReleaseVersionArchitectures
stretch0.5.4-1all
sid0.5.4-6all
jessie0.5.3-3all
buster0.5.4-5all
bullseye0.5.4-6all
bookworm0.5.4-6all
trixie0.5.4-6all
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Grinder er et alsidigt program til at skabe tilfældige shotgun og amplikon sekvensbiblioteker baseret på DNA, RNA eller proteinreferencesekvenser tilvejebragt i en FASTA-fil.

Grinder kan producere genomisk, metagenomisk, transkriptom, metatranscriptomic, proteomiske, metaproteomic shotgun og amplicon datasæt fra nuværende sekventeringsteknologier som Sanger, 454, Illumina. Disse simulerede datasæt kan bruges til at teste nøjagtigheden af bioinformatiske værktøjer under specifik hypotese, f.eks med eller uden sekventeringsfejl eller med lav eller høj samfundsmangfoldighed. Grinder kan også bruges til at hjælpe vælge mellem alternative sekventeringsmetoder til et sekvensbaseret projekt, f.eks skal biblioteket paired-end eller ej, hvor mange læsninger skal sekventeres.

Please cite: Florent E. Angly, Dana Willner, Forest Rohwer, Philip Hugenholtz and Gene W. Tyson: Grinder: a versatile amplicon and shotgun sequence simulator. (PubMed,eprint) Nucleic Acids Research Epub ahead of print (2012)
Registry entries: SciCrunch 
hilive
Realtid sammenligning af Illumina-læsninger
Versions of package hilive
ReleaseVersionArchitectures
stretch0.3-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
buster1.1-2amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0a-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0a-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.0a-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HiLive er et læs-oversættelsesværktøj som oversætter Illumina HiSeq (eller sammenlignelige) læsninger til et referencegenom lige i det øjeblik de fremstilles. Dette indebærer at læs-oversættelse er færdig lige så snart sequenceren er færdig med at oprette dataene.

Please cite: Martin S. Lindner, Benjamin Strauch, Jakob M. Schulze, Simon H. Tausch, Piotr W. Dabrowski, Andreas Nitsche and Bernhard Y. Renard: HiLive: real-time mapping of illumina reads while sequencing. (PubMed) Bioinformatics 33(6):917-919 (2017)
hinge
Assembler til læsning af lange genomer baseret på hinging
Versions of package hinge
ReleaseVersionArchitectures
buster0.5.0-4amd64,arm64,mips64el,ppc64el
bookworm0.5.0-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.5.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye0.5.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HINGE er en genomassembler, som forsøger at opnå optimal gentagelsesopslag ved at skelne gentagelser, som kan slås op givet dataene fra disse som ikke kan. Dette opnås ved at tilføje »hinges« til læsninger for at konstruere en graf med overlap hvor kun gentagelser, der ikke kunne slås op, sammenføjes. Som resultat kombinerer HINGE fejltolerancen for overlap-baserede assemblere med gentag-opslags funktioner for de Bruijn-grafassemblere.

Please cite: Govinda M Kamath, Ilan Shomorony, Fei Xia, Thomas Courtade and David N Tse: HINGE: Long-read assembly achieves optimal repeat resolution. (PubMed,eprint) Genome Research (2017)
hisat2
Grafbaseret sammenligning af korte nukleoide læsninger for mange genomer
Versions of package hisat2
ReleaseVersionArchitectures
trixie2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental2.2.1-5~0expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.0.5-1amd64
buster2.1.0-2amd64
Popcon: 7 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

HISAT2 er et hurtigt og sensitivt sammenligningsprogram for oversættelse af sekvenslæsning i næste generation (både DNA og RNA) til en population af genomer fra mennesker (samt mod et enkelt referencegenom). Baseret på en udvidelse af BWT for grafer blev et graf FM-indeks designet og implementeret. Udover at bruge et globalt GFM-indeks, som repræsenterer en population af genomer for mennesker, så bruger HISAT2 et stort sæt af små GFM-indeks, som kollektivt dækker hele genomet (hvert indeks repræsenterer et genomområde på 56 Kbp, med 55.000 indeks krævet for at dække menneskepopulationen). Disse små indeks (kaldt lokale indeks), kombineret med flere sammenligningsstrategier muliggør hurtig og præcis sammenligning af sekvenslæsninger. Dette nye indeksskema kaldes et Hierarchical Graph FM-indeks (HGFM).

The package is enhanced by the following packages: multiqc
Please cite: Daehwan Kim, Joseph M. Paggi, Chanhee Park, Christopher Bennett and Steven L. Salzberg: Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology 37(8):907-915 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
idba
Iterativ De Bruijn Graph De Novo-kortlæserassemblere
Versions of package idba
ReleaseVersionArchitectures
bullseye1.1.3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.1.2-1amd64,armel,armhf,i386
stretch1.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

IDBA står for iterative de Bruijn-grafassembler. I beregningssekvensbiologi så løser en assembler puslespillet fra store sekvensmaskiner, som har mange gigabyte med korte læsninger fra et stort genom.

Denne pakke tilbyder flere varianter af IDBA-assembleren, da de alle deler det samme kildetræ men har forskellige formål og udvikler sig over tid.

IDBA er den grundlæggende iterativ de Bruijn-grafassembler for anden generations sekvenslæsninger. IDBA-UD, en udvidelse af IDBA, er designet til at udnytte parret-slut-læsninger til at samle regioner på lav dybde og bruge progressiv dybde på config'er til at reducere fejl i regioner med høj dybde. Det er en generisk formålsassembler og specielt god til enkel-celle og metagenomiske sekvensdata. IDBA-Hybrid er en anden opdateret version af IDBA-UD, som kan gør brug af et lignende referencegenmom til at forbedre assembly-resultat. IDBA-Tran er en iterativ de Bruijn-grafassembler for RNA-seq-data.

Please cite: Yu Peng, Henry C. M. Leung, S. M. Yiu and Francis Y. L. Chin: IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. (PubMed,eprint) Bioinformatics 28(11):1420-1428 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
igdiscover
Analyserer antistof-arkiver for at finde nye V-gener
Versions of package igdiscover
ReleaseVersionArchitectures
sid0.11-4all
bullseye0.11-3all
upstream0.15.1
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

IgDiscover analyserer antistof-arkiver og registrerer nye V-gener fra høj-gennemløb sekventeringslæsninger. Tunge kæder og lette kæder for kappa og lambda er understøttet (for at registrere VH-, VK- og VL-gener).

Please cite: Martin M. Corcoran, Ganesh E. Phad, Néstor Vázquez Bernat, Christiane Stahl-Hennig, Noriyuki Sumida, Mats A.A. Persson, Marcel Martin and Gunilla B. Karlsson Hedestam: Production of individualized V gene databases reveals high levels of immunoglobulin genetic diversity.. (eprint) Nature Communications 7:13642 (2016)
Registry entries: Bio.tools  Bioconda 
igor
Infers V(D)J-rekombinationsproces fra sekvensdata
Versions of package igor
ReleaseVersionArchitectures
sid1.4.0+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.4.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.4.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.4.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

IGoR (Inference and Generation of Repertoires) er et alsidigt program til at analysere og modellere immunreceptoroprettelse, udvælgelse, mutation og alle andre processer.

Please cite: Quentin Marcou, Thierry Mora and Aleksandra M. Walczak: High-throughput immune repertoire analysis with IGoR. (PubMed,eprint) Nature Communications 9(1):561 (2018)
Registry entries: Bioconda 
igv
Integrative Genomics Viewer
Versions of package igv
ReleaseVersionArchitectures
bookworm2.16.0+dfsg-1all
bullseye2.6.3+dfsg-3 (non-free)all
jessie2.3.38+dfsg-1 (non-free)all
stretch2.3.90+dfsg-1 (non-free)all
sid2.17.3+dfsg-1all
trixie2.17.3+dfsg-1all
Debtags of package igv:
fieldbiology
interfacex11
networkclient
roleprogram
scopeutility
useviewing
works-withbiological-sequence
Popcon: 15 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Integrative Genomics Viewer (IGV) er en højtydende fremviser, der effektivt håndterer store hererogene datasæt, mens der samtidig tilbydes en intuitiv brugeroplevelse på alle niveauer af genomopslag. Et nøglekarakteristika for IGV er dets fokus på den integrerede natur i genomstudier, med understøttelse for både tabelbaserede og næste generation-sekventeringsdata samt integrationen af kliniske og fænotypiske data. Selvom IGV ofte bruges til at vise genomiske data fra offentlige kilder, så er dets primære mål at understøtte forskere, der ønsker at visualisere og udforske deres egne datasæt eller dem fra kollegaer. Til den brug understøtter IGV fleksibel indlæsning af lokale og eksterne datasæt, og er optimeret til at tilbyde højtydende datavisualisering og udforskning på skrivebordssystemer.

Please cite: James T Robinson, Helga Thorvaldsdóttir, Wendy Winckler, Mitchell Guttman, Eric S Lander, Gad Getz and Jill P Mesirov: Integrative genomics viewer. (PubMed,eprint) Nature Biotechnology 29(1):24–26 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
iva
Iterativ virussekvensassembler
Versions of package iva
ReleaseVersionArchitectures
bookworm1.0.11+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster1.0.9+ds-6amd64,arm64,mips64el,ppc64el
bullseye1.0.9+ds-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid1.0.11+ds-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
stretch1.0.8+ds-1amd64,arm64,mips64el,ppc64el
trixie1.0.11+ds-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

IVA er en de novo-assembler designet til at samle virusgenomer, som ikke har gentagelsessekvenser, via Illuminalæste par sekventeret fra blandede populationer ved ekstrem høj dybde.

IVA's hovedalgoritme fungerer ved iterativt at udvide config'er via justerede læste par. Dets inddata kan bare være læste par, eller du kan derudover tilbyde et eksisterende sæt af contig'er til udvidelse. Alternativt kan programmet anvende læsninger sammen med en referencesekvens.

Please cite: M. Hunt, A. Gall, S. H. Ong, J. Brener, B. Ferns, P. Goulder, E. Nastouli, J. A. Keane, P. Kellam and T. D. Otto: IVA: accurate de novo assembly of RNA virus genomes. (PubMed) Bioinformatics 31(14):2374-2376 (2015)
Registry entries: Bio.tools  Bioconda 
khmer
I-hukommelse DNA-sekvens kmer-optælling, filtrering og grafgennemløb
Versions of package khmer
ReleaseVersionArchitectures
bookworm3.0.0~a3+dfsg-4amd64
stretch2.0+dfsg-10amd64,arm64,mips64el,ppc64el
bullseye2.1.2+dfsg-8amd64,arm64
sid3.0.0~a3+dfsg-8amd64
trixie3.0.0~a3+dfsg-8amd64
buster2.1.2+dfsg-6amd64,arm64
experimental3.0.0~a3+dfsg-9~0expamd64
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Khmer et et bibliotek og programpakke med værktøjer for kommandolinjen til arbejdet med DNA-sekvenser. Det er primært rettet mod kort-læs sekvensdata såsom dem lavet af Illuminaplatformen. Khmer bruger en k-mer-centrisk fremgangsmåde til sekvensanalyse, deraf navnet.

Please cite: Michael R. Crusoe, Hussien F. Alameldin, Sherine Awad, Elmar Bucher, Adam Caldwell, Reed Cartwright, Amanda Charbonneau, Bede Constantinides, Greg Edvenson, Scott Fay, Jacob Fenton, Thomas Fenzl, Jordan Fish, Leonor Garcia-Gutierrez, Phillip Garland, Jonathan Gluck, Iván González, Sarah Guermond, Jiarong Guo, Aditi Gupta, Joshua R. Herr, Adina Howe, Alex Hyer, Andreas Härpfer, Luiz Irber, Rhys Kidd, David Lin, Justin Lippi, Tamer Mansour, Pamela McA'Nulty, Eric McDonald, Jessica Mizzi, Kevin D. Murray, Joshua R. Nahum, Kaben Nanlohy, Alexander Johan Nederbragt, Humberto Ortiz-Zuazaga, Jeramia Ory, Jason Pell, Charles Pepe-Ranney, Zachary N Russ, Erich Schwarz, Camille Scott, Josiah Seaman, Scott Sievert, Jared Simpson, Connor T. Skennerton, James Spencer, Ramakrishnan Srinivasan, Daniel Standage, James A. Stapleton, Joe Stein, Susan R Steinman, Benjamin Taylor, Will Trimble, Heather L. Wiencko, Michael Wright, Brian Wyss, Qingpeng Zhang, en zyme and C. Titus Brown: The khmer software package: enabling efficient sequence analysis. (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
kissplice
Detektion af diverse slags polymorfismer i RNA-sekvensdata
Versions of package kissplice
ReleaseVersionArchitectures
bullseye2.5.3-3amd64,arm64,mips64el,ppc64el
sid2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
trixie2.6.2-3amd64,arm64,mips64el,ppc64el
buster2.4.0-p1-4amd64,arm64,mips64el,ppc64el
stretch2.4.0-p1-1amd64,arm64,mips64el,ppc64el
jessie2.2.1-3amd64
Debtags of package kissplice:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 7 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

KisSplice er et program, som gør det muligt at analysere RNA-sekvensdata med eller uden en referencearvemasse. Det er en præcis lokal transcriptome assembler hvor du kan identificere SNP'er, indels og alternative splicing-hændelser. Programmet kan håndtere et arbitrært antal biologiske betingelser og vil kvantificere hver variant i hver betingelse. Programmet er blevet testet på Illumina-datasæt på op til 1G-læsninger. Dets hukommelsesforbrug er omkring 5 Gb for 100 millioner læsninger.

Please cite: Gustavo AT Sacomoto, Janice Kielbassa, Rayan Chikhi, Raluca Uricaru, Pavlos Antoniou, Marie-France Sagot, Pierre Peterlongo and Vincent Lacroix: KISSPLICE: de-novo calling alternative splicing events from RNA-seq data. (PubMed,eprint) BMC Bioinformatics 13((Suppl 6)):S5 (2012)
Registry entries: SciCrunch  Bioconda 
Topics: RNA-seq; RNA splicing; Gene structure
kraken
Tildeling af taksonomiske etiketter til korte DNA-sekvenser
Versions of package kraken
ReleaseVersionArchitectures
sid1.1.1-4amd64,arm64,mips64el,ppc64el,riscv64
stretch-backports1.1-2~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.1.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.1.1-4amd64,arm64,mips64el,ppc64el
trixie1.1.1-4amd64,arm64,mips64el,ppc64el
stretch0.10.5~beta-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken er et system til tildeling af taksonomiske etiketter til korte DNA- sekvenser, normalt indhentet via metagenomiske studier. Tidligere forsøg fra andre bioinformatikprogrammer på at fuldføre denne opgave har ofte brugt sekvenssammenligning eller maskinindlæringsteknikker, som var ret så langsomme, hvilket førte til udviklingen af mindre sensitive men meget hurtigere programmer for overflodsestimering. Kraken forsøger at opnå høj sensitivitet og høj hastighed ved at udnytte præcise sammenligninger af k- mers og en ny klassifikationsalgoritme.

I sin hurtigste operationstilstand, for et simuleret metagenom for 100 bp- læsninger, behandlede Kraken over 4 millioner læsninger per minut på en enkel kerne, over 900 gange hurtigere end Megablast og over 11 gange hurtigere end overflodsestimeringsprogrammet MetaPhlAn. Krakens præcision er sammenlignelig med Megablast, med en smule mindre sensitivitet og meget høj præcision.

The package is enhanced by the following packages: jellyfish1 multiqc
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.tools  Bioconda 
kraken2
Taksonomisk klassifikationssystem der bruger præcise k-mer-træffere
Versions of package kraken2
ReleaseVersionArchitectures
bullseye2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 10 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken 2 er den nyeste version af Kraken, et taksonomisk klassifikationssystem, der bruger præcise k-mer-træffere til at opnå høj præcision og hurtige klassifikationshastigheder. Dette program matcher hver k-mer i en forespørgelsessekvens til den laveste fælles forfader (LCA) for alle genomer indeholdende den angivne k-mer. K-mer- opgaverne informerer klassifikationsalgoritmen. (se: Kraken 1's internetside for detaljer).

Kraken 2 tilbyder signifikante forbedringer til Kraken 1, med hurtigere databasebyggetider, mindre databasestørrelser og hurtigere klassifikationshastigheder. Disse forbedringer blev opnået af de følgende opdateringer til klassifikationsprogrammet Kraken:

 1. Storage of Minimizers: Instead of storing/querying entire k-mers,
    Kraken 2 stores minimizers (l-mers) of each k-mer. The length of
    each l-mer must be ≤ the k-mer length. Each k-mer is treated by
    Kraken 2 as if its LCA is the same as its minimizer's LCA.
 2. Introduction of Spaced Seeds: Kraken 2 also uses spaced seeds to
    store and query minimizers to improve classification accuracy.
 3. Database Structure: While Kraken 1 saved an indexed and sorted list
    of k-mer/LCA pairs, Kraken 2 uses a compact hash table. This hash
    table is a probabilistic data structure that allows for faster
    queries and lower memory requirements. However, this data structure
    does have a <1% chance of returning the incorrect LCA or returning
    an LCA for a non-inserted minimizer. Users can compensate for this
    possibility by using Kraken's confidence scoring thresholds.
 4. Protein Databases: Kraken 2 allows for databases built from amino
    acid sequences. When queried, Kraken 2 performs a six-frame
    translated search of the query sequences against the database.
 5. 16S Databases: Kraken 2 also provides support for databases not
    based on NCBI's taxonomy. Currently, these include the 16S
    databases: Greengenes, SILVA, and RDP.
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.tools  Bioconda 
last-align
sammenligning af biologisk sekvenser på genom-skala
Versions of package last-align
ReleaseVersionArchitectures
trixie1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie490-1amd64,armel,armhf,i386
bullseye1179-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster963-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1447-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 9 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

LAST er programmel til sammenligning og justering af sekvenser, typisk DNA- eller protein-sekvenser. LAST ligner BLAST, men det er bedre til at håndtere meget store mængder af sekvensdata. Her er to ting som LAST er god til:

  • Sammenligning af store (eksempelvis pattedyrs) genomer.
  • Kortlægge masser af sekvens-mærker oven på et genom.

Den primære, tekniske innovation er at LAST finder indledende samstemmende forekomster, baseret på deres mangfoldighed, i stedet for at benytte en fast størrelse (BLAST bruger eksempelvis 10-mers). Dette gør, at man kan kortlægge mærker til genomer, uden gentagelsesmaskering (eng. »repeat- masking«), uden at blive overvældet af gentagne forekomster. For at finde disse forekomster som har forskellige størrelser, så bruger den en suffiks- række (inspireret af Vmatch). For at opnå høj følsomhed, så bruger den en usammenhængende suffiks-række, der er en analog til frø som placeres med mellemrum.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
libvcflib-tools
C++-bibliotek til at fortolke og manipulere VCF-filer - værktøjer
Versions of package libvcflib-tools
ReleaseVersionArchitectures
bookworm1.0.3+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster-backports1.0.1+dfsg-3~bpo10+1amd64
stretch1.0.0~rc1+dfsg1-3amd64
stretch-backports1.0.0~rc1+dfsg1-6~bpo9+1amd64
buster1.0.0~rc2+dfsg-2amd64
sid1.0.9+dfsg1-3amd64,arm64,mips64el,ppc64el,riscv64
trixie1.0.9+dfsg1-3amd64,arm64,mips64el,ppc64el
bullseye1.0.2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Variant Call Format (VCF) er en flad fil, indryk afgrænser tekstformatet, lavet til præcist at beskrive referenceindekserede variationer mellem individer. VCF tilbyder et fælles udvekslingsformat for beskrivelsen af variation i individer og befolkninger, og har nogle standardformater til rapportering for en bred vifte af registreringsprogrammer til genvarianter.

Vcflib tilbyder metoder til at manipulere og fortolke sekvensvariation som det er beskrevet af VCF. Det er både:

  • en API til at fortolke og arbejde på poster med genvariation, som det kan beskrives af VCF-formatet
  • og en samling af kommandolinjeredskaber for afvikling af komplekse manipuleringer på VCF-filer.

Denne pakke indeholder flere værktøjer, der bruger biblioteket.

macs
Modelbaseret analyse af ChIP-Seq på korte læsesekvenser
Versions of package macs
ReleaseVersionArchitectures
stretch2.1.1.20160309-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.0.1-2amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
buster2.1.2.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.0.9.1-1amd64,armel,armhf,i386
trixie3.0.1-2amd64,arm64,armel,armhf,i386,ppc64el,s390x
bullseye2.2.7.1-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
bookworm2.2.7.1-6amd64,arm64,armel,armhf,i386,ppc64el,s390x
Popcon: 11 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MACS opbygger empirisk længden af de sekventerede ChIP-fragmenter, som tenderer til at være kortere end lydbehandling eller størrelsesestimater for bibliotekskonstruktion og bruger den til at forbedre den rumlige opløsning af forudsagte bindingssteder. MACS bruger også en dynamisk Poisson-fordeling til effektivt at fange lokale skævheder i arvemassesekvensen, hvilket giver mulighed for mere følsom og robust forudsigelse. MACS sammenligner positivt til eksisterende ChIP-Seq peak-finding-algoritmer, er offentligt tilgængelig åben kildekode og kan bruges til ChIP-Seq med eller uden kontrolprøver.

Please cite: Yong Zhang, Tao Liu, Clifford A Meyer, Jérôme Eeckhoute, David S. Johnson, Bradley E. Bernstein, Chad Nussbaum, Richard M. Myers, Myles Brown, Wei Li and X Shirley Liu: Model-based Analysis of ChIP-Seq (MACS). (PubMed,eprint) Genome Biol. 9(9):R137 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mapdamage
tracking and quantifying damage patterns in ancient DNA sequences
Versions of package mapdamage
ReleaseVersionArchitectures
stretch2.0.6+dfsg-2all
buster2.0.9+dfsg-1all
bullseye2.2.1+dfsg-1all
trixie2.2.1+dfsg-3all
sid2.2.1+dfsg-3all
bookworm2.2.1+dfsg-3all
upstream2.2.2
Popcon: 9 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

MapDamage is a computational framework written in Python and R, which tracks and quantifies DNA damage patterns among ancient DNA sequencing reads generated by Next-Generation Sequencing platforms.

MapDamage is developed at the Centre for GeoGenetics by the Orlando Group.

Please cite: Hákon Jónsson, Aurélien Ginolhac, Mikkel Schubert and Philip Johnson and Ludovic Orlando: mapDamage2.0: fast approximate Bayesian estimates of ancient DNA damage parameters. (PubMed,eprint) Bioinformatics 29(13):1682-4 (2013)
Registry entries: SciCrunch  Bioconda 
mapsembler2
Bioinformatik målrettet programmer til samling
Versions of package mapsembler2
ReleaseVersionArchitectures
jessie2.1.6+dfsg-1amd64,armel,armhf,i386
sid2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
trixie2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
bookworm2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
bullseye2.2.4+dfsg1-3amd64,arm64,ppc64el,s390x
buster2.2.4+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
stretch2.2.3+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Mapsembler2 er et målrettet program til samling. Det bruger et datasæt af rå NGS-læsninger (fasta eller fastq, gzippet eller ej) og et datasæt af sekvenser (startere).

Det bestemmer først om hver starter er read-coherent, f.eks. om læsninger bekræfter tilstedeværelsen af hver starter i den oprindelige sekvens. For hver read-coherent-starter laver Mapsembler2 dens sekvensnaboskab som en lineær sekvens eller som en graf, afhængig af brugervalget.

Mapsembler2 kan bruges for (men ikke begrænset til):

  • Valider en samlet sekvens (inddata som starter), f.eks. fra en de Bruijn-grafsamling hvor read-coherence ikke blev påtvunget
  • Kontrollere om et gen (inddata som starter) har en homolog i et sæt af læsninger
  • Kontrollere om et kendt enzym er til stede i en metagenomisk NGS- læst sæt
  • Berige læsninger der ikke kan kortlægges ved at udvide dem, eventuelt gøre dem egnet for kortlægning
  • Kontrollere hvad der sker i ekstremiteterne af en contig
  • Fjerne forureninger eller symbiont-læsninger fra et læst sæt
Please cite: Pierre Peterlongo and Rayan Chikhi: Mapsembler, targeted and micro assembly of large NGS datasets on a desktop computer. (PubMed) BMC Bioinformatics 13:48 (2012)
Registry entries: Bio.tools  Bioconda 
maq
kortlægger korte, fast-længde, polymorfiske DNA-sekvenslæsninger til reference-sekvenser
Versions of package maq
ReleaseVersionArchitectures
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.7.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie0.7.1-5amd64,armel,armhf,i386
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 18 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (forkortelse af »Mapping and Assembly with Quality«) bygger kortlagte montager fra korte læsninger genereret af næste generation inden for maskiner til sekvensering. Det blev særligt designet til »Illumina-Solexa 1G Genetic Analyzer«, og har indledende funktionalitet til at håndtere ABI SOLid-data. Maq var tidligere kendt som mapass2.

Udvikling af Maq stoppede i 2008. Dets efterfølger er BWA og SAMtools.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
maqview
Grafisk fremviser for læsesammenligninger for korte gensekvenser
Versions of package maqview
ReleaseVersionArchitectures
trixie0.2.5-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie0.2.5-6amd64,armel,armhf,i386
stretch0.2.5-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.2.5-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.2.5-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2.5-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.2.5-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Maqview er en grafisk fremviser for læsesammenligning. Den er specifikt designet for sammenligningsfilen Maq og giver dig mulighed for at se forskelle, basiskvaliteter og oversættelseskvaliteter. Maqview er ikke så smart som Consed eller GAP, men bare en simpel fremviser, så du kan se hvad der sker i et bestemt område.

I sammenligning med tgap-maq er den tekstbaserede fremviser for læsesammenligninger Maqview skrevet af James Bonfield hurtigere og den bruger mindre hukommelse og diskplads i sine indeks. Dette er muligt da tgap forsøger at være en almen fremviser, mens Maqview fuldt ud gør brug af det faktum, at en Maq-sammenligningsfil allerede er blevet sorteret. Maqview er også effektiv i fremvisning og tilbyder et kommandolinjeværktøj til hurtigt at hente ethvert område i en Maq-sammenligningsfil.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
mhap
Lokalitetsfølsom hashing for at registrere long-read-overlap
Versions of package mhap
ReleaseVersionArchitectures
stretch2.1.1+dfsg-1all
bookworm2.1.3+dfsg-3all
sid2.1.3+dfsg-3all
bullseye2.1.3+dfsg-3all
buster2.1.3+dfsg-2all
stretch-backports2.1.3+dfsg-1~bpo9+1all
trixie2.1.3+dfsg-3all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

MinHash Alignment Process (MHAP--pronounced MAP) er en referenceimplementering af en overlappende probabilistisk sekvensalgoritme. Designet til effektivt at registrere alle overlap mellem støjende long-read sekvensdata. Det estimerer effektivt Jaccard-lighed ved at komprimere sekvenser til deres repræsentative fingeraftryk sammensat på min-mers (minimum k-mer).

Please cite: Konstantin Berlin, Sergey Koren, Chen-Shan Chin, James P Drake, Jane M Landolin and Adam M Phillippy: Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. (PubMed) Nature Biotechnology 33(6):623–630 (2015)
Registry entries: Bioconda 
microbiomeutil
Microbiome - analyseredskaber
Versions of package microbiomeutil
ReleaseVersionArchitectures
jessie20101212+dfsg-1all
sid20101212+dfsg1-5all
buster20101212+dfsg1-2all
stretch20101212+dfsg1-1all
trixie20101212+dfsg1-5all
bullseye20101212+dfsg1-4all
bookworm20101212+dfsg1-5all
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Pakken microbiomeutil indeholder de følgende redskaber:

  • ChimeraSlayer: ChimeraSlayer for chimera-registrering
  • NAST-iEr: NAST-baseret sammenligningsværktøj
  • WigeoN: En ny implementering af anomaliregistreringsredskabet Pintail 16S
  • RESOURCES: Reference 16S-sekvenser og NAST-sammenligninger som ovenstående værktøjer udnytter
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
mira-assembler
Hel Genome Shotgun og EST Sequence Assembler
Versions of package mira-assembler
ReleaseVersionArchitectures
buster4.9.6-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.0.2-1amd64,armel,armhf,i386
trixie4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye4.9.6-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.9.6-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch4.9.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package mira-assembler:
roleprogram
Popcon: 7 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Mira er en specialiseret gensekvenssamler for sekvensprojekter regnet som »svære« på grund af et stort antal ensformige gentagelser. For expressed sequence tags-transskriptioner (EST'er) er miraEST specialiseret på rekonstruktion af urørte mRNA-transskriptioner mens det detekterer og klassificerer enlige nukleotidpolymorfismer (SNP), der opstår i forskellige variationer herudfra.

Sekvenssamleren bruges rutinemæssigt til forskellige opgaver såsom mutationsdetektering i forskellige celletyper, analyser af ligheder i transskriptioner mellem organismer og samling af urørte sekvenser fra forskellige kilder for oligodesign i kliniske mikroarrayeksperimenter.

Pakken tilbyder følgende kørbare filer:

  • mira: for samling af genomsekvenser
  • miramem: estimerer hukommelsen krævet af et projekt. Fungerer ved at lænke til mira.
  • mirabait: et »grep«-lignende værktøj til at vælge læsninger med kmerer op til 256 baser.
  • miraconvert: er et værktøj til at konvertere, udtrække og nogle gange genberegne alle slags data relateret til sekvenssamlingsfiler.
Please cite: Bastien Chevreux, Thomas Pfisterer, Bernd Drescher, Albert J. Driesel, Werner E. G. Müller, Thomas Wetter and Sándor Suhai: Using the miraEST Assembler for Reliable and Automated mRNA Transcript Assembly and SNP Detection in Sequenced ESTs. (PubMed,eprint) Genome Research 14(6):1147-1159 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mothur
Programpakke for sekvensanalyse til forskning i mikrobiota
Versions of package mothur
ReleaseVersionArchitectures
bullseye1.44.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.38.1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.41.21-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.33.3+dfsg-2amd64,armel,armhf,i386
Debtags of package mothur:
roleprogram
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Mothur søger at udvikle et enkelt stykke open source program, der kan udvides til at fylde bioinformatikbehov i mikrobiel økologisamfund. Den har indbygget funktionalitet for dotur, sons, treeclimber, s-libshuff, unifrac og meget mere. Ud over at forbedre fleksibiliteten af disse algoritmer er en række andre funktioner, herunder regnemaskiner og visualiseringsværktøjer, blevet tilføjet.

Please cite: Patrick D Schloss, Sarah L Westcott, Thomas Ryabin, Justine R Hall, Martin Hartmann, Emily B Hollister, Ryan A Lesniewski, Brian B Oakley, Donovan H Parks, Courtney J Robinson, Jason W Sahl, Blaz Stres, Gerhard G Thallinger, David J Van Horn and Carolyn F Weber: Introducing mothur: Open-source, platform-independent, community-supported software for describing and comparing microbial communities. (PubMed) Appl Environ Microbiol 75(23):7537-7541 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
nanopolish
Konsensuskalder for nanopore-sekvensdata
Versions of package nanopolish
ReleaseVersionArchitectures
buster0.11.0-2amd64
stretch0.5.0-1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
sid0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.13.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports0.10.2-1~bpo9+1amd64
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Nanoplish bruger en skjult Markovmodel på signalniveau til konsensuskald af nanospores genomsekvensdata. Programmet kan udføre analyse på signalniveau for Oxford Nanopore-sekvensdata. Nanopolish kan beregne en forbedret konsensussekvens for en kladdegenomsamling, registrere baseændringer, kalde SNP'er og indels med respekt for et referencegenom med mere.

Registry entries: Bio.tools  SciCrunch  Bioconda 
paleomix
Datakanaler og værktøjer til at behandle ældre og moderne HTS-data
Versions of package paleomix
ReleaseVersionArchitectures
buster1.2.13.3-1amd64
bullseye1.3.2-1amd64,arm64,mips64el,ppc64el
bookworm1.3.7-3amd64,arm64
trixie1.3.8-1amd64,arm64
sid1.3.8-1amd64,arm64
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PALEOMIX-datakanaler er et sæt af datakanaler og værktøjer designet til at hjælpe med hurtig behandling af HTS-data (High-Throughput Sequencing): BAM-datakanalen behandler de-multipleksede læsninger fra en eller flere prøver, gennem sekvensbehandling og sammenligning for at oprette BAM-sammenligningsfiler, der er nyttige i downstream-analyser; den fylogenetiske datakanal udfører genbestemmelse og filogenetisk inferens på BAM-sammenligningsfiler, enten fremstillet ved hjælp af BAM-datakanalen eller oprettet andetsteds; og Zonkey-datakanalen udfører en række analyser på lavt dækkede equine-sammenligninger for at registrere tilstedeværelsen af F1-hybrider i arkæologiske samlinger. Derudover hjælper PALEOMIX med metagenomisk analyse af ekstrakterne.

Datakanalerne er designet med gammelt DNA (aDNA) i tankerne, og inkluderer adskillige funktioner, der er specielt nyttige til analyser af gamle prøver, men kan alle også være til behandling af moderne prøver, for at sikre ensartet databehandling.

Please cite: Mikkel Schubert, Luca Ermini, Clio Der Sarkissian, Hákon Jónsson, Aurélien Ginolhac, Robert Schaefer, Michael D Martin, Ruth Fernández, Martin Kircher, Molly McCue, Eske Willerslev and Ludovic Orlando: Characterization of ancient and modern genomes by SNP detection and phylogenomic and metagenomic analysis using PALEOMIX. (PubMed) Nature Protocols 9(5):1056-82 (2014)
Registry entries: Bio.tools  SciCrunch 
pbhoney
genomic structural variation discovery
Versions of package pbhoney
ReleaseVersionArchitectures
stretch15.8.24+dfsg-2all
bullseye15.8.24+dfsg-7all
sid15.8.24+dfsg-7all
bookworm15.8.24+dfsg-7all
trixie15.8.24+dfsg-7all
buster15.8.24+dfsg-3all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PBHoney is an implementation of two variant-identification approaches designed to exploit the high mappability of long reads (i.e., greater than 10,000 bp). PBHoney considers both intra-read discordance and soft-clipped tails of long reads to identify structural variants.

PBHoney is part of the PBSuite.

pbjelly
genome assembly upgrading tool
Versions of package pbjelly
ReleaseVersionArchitectures
bookworm15.8.24+dfsg-7all
sid15.8.24+dfsg-7all
bullseye15.8.24+dfsg-7all
trixie15.8.24+dfsg-7all
stretch15.8.24+dfsg-2all
buster15.8.24+dfsg-3all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PBJelly is a highly automated pipeline that aligns long sequencing reads (such as PacBio RS reads or long 454 reads in fasta format) to high-confidence draft assembles. PBJelly fills or reduces as many captured gaps as possible to produce upgraded draft genomes.

PBJelly is part of the PBSuite.

pbsuite
Program for Pacific Biosciences-sekvensdata
Versions of package pbsuite
ReleaseVersionArchitectures
bookworm15.8.24+dfsg-7all
buster15.8.24+dfsg-3all
sid15.8.24+dfsg-7all
stretch15.8.24+dfsg-2all
trixie15.8.24+dfsg-7all
bullseye15.8.24+dfsg-7all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

PBSuite indeholder to projekter oprettet til analyse af Pacific Biosciences long-read sekvensdata.

  • PBJelly - opgraderingsværktøj for genomer
  • PBHoney - strukturel registrering af variation
picard-tools
Kommandolinjeværktøjer til at manipulere SAM- og BAM-filer
Versions of package picard-tools
ReleaseVersionArchitectures
trixie3.1.1+dfsg-1all
sid3.1.1+dfsg-1all
bullseye2.24.1+dfsg-1all
buster2.18.25+dfsg-2amd64
jessie1.113-1all
stretch2.8.1+dfsg-1all
bookworm2.27.5+dfsg-2all
Popcon: 12 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

SAM-formatet (Sequence Alignment/Map) er et generisk format til at lagre store sammenligninger af nukleotidsekvenser. Picard Tools indeholder disse redskaber til at manipulere SAM- og BAM-filer:

 AddCommentsToBam                  FifoBuffer
 AddOrReplaceReadGroups            FilterSamReads
 BaitDesigner                      FilterVcf
 BamIndexStats                     FixMateInformation
                                   GatherBamFiles
 BedToIntervalList                 GatherVcfs
 BuildBamIndex                     GenotypeConcordance
 CalculateHsMetrics                IlluminaBasecallsToFastq
 CalculateReadGroupChecksum        IlluminaBasecallsToSam
 CheckIlluminaDirectory            LiftOverIntervalList
 CheckTerminatorBlock              LiftoverVcf
 CleanSam                          MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics    MarkDuplicates
 CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics              MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics        MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics        MergeSamFiles
 CollectInsertSizeMetrics          MergeVcfs
 CollectJumpingLibraryMetrics      NormalizeFasta
 CollectMultipleMetrics            PositionBasedDownsampleSam
 CollectOxoGMetrics                QualityScoreDistribution
 CollectQualityYieldMetrics        RenameSampleInVcf
 CollectRawWgsMetrics              ReorderSam
 CollectRnaSeqMetrics              ReplaceSamHeader
 CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics  RevertSam
 CollectTargetedPcrMetrics         SamFormatConverter
 CollectVariantCallingMetrics      SamToFastq
 CollectWgsMetrics                 ScatterIntervalsByNs
 CompareMetrics                    SortSam
 CompareSAMs                       SortVcf
 ConvertSequencingArtifactToOxoG   SplitSamByLibrary
 CreateSequenceDictionary          SplitVcfs
 DownsampleSam                     UpdateVcfSequenceDictionary
 EstimateLibraryComplexity         ValidateSamFile
 ExtractIlluminaBarcodes           VcfFormatConverter
 ExtractSequences                  VcfToIntervalList
 FastqToSam                        ViewSam
The package is enhanced by the following packages: multiqc
Please cite: Broad Institute: Picard toolkit. Broad Institute, GitHub repository (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing; Document, record and content management
pirs
Profile based Illumina pair-end Reads Simulator
Versions of package pirs
ReleaseVersionArchitectures
sid2.0.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.0.2+dfsg-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.0.2+dfsg-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.0.2+dfsg-5.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.0.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The program pIRS can be used for simulating Illumina PE reads, with a series of characters generated by Illumina sequencing platform, such as insert size distribution, sequencing error(substitution, insertion, deletion), quality score and GC content-coverage bias.

The insert size follows a normal distribution, so users should set the mean value and standard deviation. Usually the standard deviation is set as 1/20 of the mean value. The normal distribution by Box-Muller method is simulated.

The program simulates sequencing error, quality score and GC content- coverage bias according to the empirical distribution profile. Some default profiles counted from lots of real sequencing data are provided.

To simulate reads from diploid genome, users should simulate the diploid genome sequence firstly by setting the ratio of heterozygosis SNP, heterozygosis InDel and structure variation.

Please cite: Xuesong Hu, Jianying Yuan, Yujian Shi, Jianliang Lu, Binghang Liu, Zhenyu Li, Yanxiang Chen, Desheng Mu, Hao Zhang, Nan Li, Zhen Yue, Fan Bai, Heng Li and Wei Fan: pIRS: Profile-based Illumina pair-end reads simulator. (PubMed,eprint) Bioinformatics 28(11):1533-5 (2012)
Registry entries: Bioconda 
pizzly
Identificerer genfusioner i RNA-sekventeringsdata
Versions of package pizzly
ReleaseVersionArchitectures
bookworm0.37.3+ds-9amd64,arm64,mips64el,ppc64el,s390x
sid0.37.3+ds-9amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie0.37.3+ds-9amd64,arm64,mips64el,ppc64el,s390x
bullseye0.37.3+ds-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Til fortolkningen af transkriptomet (overfloden og sekvens af RNA) af kræftceller er man især interesseret i transskriptioner, der ikke kan kortlægges til enkeltstående gener, men som ses at være fusioneret som dele fra to gener. Sandsynlige forklaringer er kromosomale translokationer.

Pizzly kan identificere nye sådanne særheder ved at bygge videre på fortolkninger af variabel splejsning med værktøjet kallisto. Begge værktøjer er elementer i bcbio-arbejdsgangen.

Registry entries: Bioconda 
placnet
Plasmid Constellation Network-projekt
Versions of package placnet
ReleaseVersionArchitectures
bookworm1.04-1all
stretch1.03-2all
bullseye1.03-3all
trixie1.04-1all
sid1.04-1all
buster1.03-3all
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Placnet er et nyt værktøj til plasmid-analyse i NGS-projekter. Placnet er optimeret til arbejdet med Illumina-sekvenser, men fungerer også med 454, Iontorrent eller en af de nuværende sekvensteknologier.

Dataene til placnet er et sæt af konfigurationer og en eller flere SAM-filer med kortlægningen af læsninger mod konfigurationer. Placnet indhenter et sæt af filer, nemt åbnet med Cytoscape-programmet eller andre netværksværktøjer.

Please cite: Val F. Lanza, María de Toro, M. Pilar Garcillán-Barcia, Azucena Mora, Jorge Blanco, Teresa M. Coque and Fernando de la Cruz: Plasmid Flux in Escherichia coli ST131 Sublineages, Analyzed by Plasmid Constellation Network (PLACNET), a New Method for Plasmid Reconstruction from Whole Genome Sequences. (PubMed,eprint) PLOS 10(12):e1004766 (2014)
poretools
Værktøjssæt til nanopores nukleotidsekventeringsdata
Versions of package poretools
ReleaseVersionArchitectures
bullseye0.6.0+dfsg-5all
sid0.6.0+dfsg-6all
trixie0.6.0+dfsg-6all
stretch0.6.0+dfsg-2all
bookworm0.6.0+dfsg-6all
buster0.6.0+dfsg-3all
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Poretools er et fleksibelt værktøjssæt til at undersøge datasæt oprettet af nanopores sekvensenheder fra MinION til kvalitetskontrol og analyse af downstream. Poretools fungerer direkte på standardfilformatet FAST5 (en variant af HDF5-standarden) fremstillet af ONT og tilbyder en mængde af redskaber til formatkonvertering og dataundersøgelse samt visualiseringsværktøjer.

Please cite: Nicholas Loman and Aaron Quinlan: Poretools: a toolkit for analyzing nanopore sequence data. (PubMed,eprint) Bioinformatics 30(23):3399-3401 (2014)
Registry entries: Bio.tools  Bioconda 
python3-airr
Data Representation Standard-bibliotek for antibody- og TCR-sekvenser
Versions of package python3-airr
ReleaseVersionArchitectures
bullseye1.3.1-1all
sid1.5.0-1all
buster1.2.1-2all
trixie1.5.0-1all
bookworm1.3.1-1all
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Denne pakke tilbyder et bibliotek fra AIRR-fællesskabet til at beskrive, rapportere, lagre og dele »adaptive immune receptor repertoire«-data (AIRR), såsom sekvenser for antibodies og T-cellereceptorer (TCR'er). Nogle specifikke indsatser er:

  • MiAIRR-standarden til at beskrive minimal information om AIRR-datasæt, inklusive prøvesamling og databehandlingsinformation
  • Datarepræsentationsspecifikationer (filformat) til at lagre store mængder af kommenterede AIRR-data
  • API'er til at vise en fælles grænseflade til arkiver/databaser indeholdende AIRR-data
  • En fællesskabsstandard for programværktøjer der tillader at overholdende værktøjer opnår anerkendelse i fællesskabet

Denne pakke installerer biblioteket for Python 3.

python3-gffutils
Arbejd med GFF- og GTF-filer i en fleksibel databaseramme
Versions of package python3-gffutils
ReleaseVersionArchitectures
bookworm0.11.1-3all
buster0.9-1all
bullseye0.10.1-2all
sid0.12-3all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

En Pythonpakke til arbejdet med og manipulering af GFF- og GTF-formatfiler typisk brugt til genom-annonationer. Filer indlæses i en sqlite3-database, hvilket gør det muligt at bruge mere kompleks manipulering af hierarkiske funktioner (f.eks. gener, udskrifter og exon'er) end det er muligt med rene tekstmetoder.

Registry entries: Bio.tools  Bioconda 
python3-presto
Værktøjssæt til at behandle B- og T-cellesekvenser - Python 3-modul
Versions of package python3-presto
ReleaseVersionArchitectures
sid0.7.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.6.2-1all
buster0.5.10-1all
bookworm0.7.1-1all
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

pRESTO er et værktøjssæt til at behandle rå læsninger fra høj-gennemløb sekventering af B-celle- og T-celle-repertoirer.

Dramatiske forbedringer i høj-gennemløb sekventeringsteknologier gør det nu muligt at foretage karakterisering i høj skala af lymfocytrepertoirer, defineret som samlingen af trans-membrane antigen-receptor-proteinger lokaliseret på overfladen af B-celler og T-celler. REpertoire Sequencing TOolkit (pRESTO) er sammensat af en programpakke af redskaber til at håndtere alle trin af sekvensbehandling før germline-segmentopgaven.

Denne pakke indeholder Python 3-modulet for presto.

Please cite: Jason A. Vander Heiden, Gur Yaari, Mohamed Uduman, Joel N.H. Stern, Kevin C. O’Connor, David A. Hafler, Francois Vigneault and Steven H. Kleinstein: pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. (PubMed,eprint) Bioinformatics 30(13):1930-1932 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
python3-pybedtools
Python 3-omslag omkring BEDTools for bioinformatikarbejde
Versions of package python3-pybedtools
ReleaseVersionArchitectures
sid0.9.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
buster0.8.0-1amd64,arm64,mips64el,ppc64el
trixie0.9.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bullseye0.8.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm0.9.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

BEDTools-programpakken er bredt anvendt til manipulation af genominterval eller »genomalgebra«. Pybedtools omslutter og udvider BEDTools og tilbyder manipulationer på funktionsniveau inde fra Python.

Dette er Python 3-versionen.

Please cite: R. K. Dale, B. S. Pedersen and A. R. Quinlan: Pybedtools: a flexible Python library for manipulating genomic datasets and annotations". Bioinformatics 27(24):3423-3424 (2011)
Registry entries: Bio.tools  Bioconda 
python3-sqt
SeQuencing-værktøjer for biologiske DNA/RNA-data med høj gennemløb
Versions of package python3-sqt
ReleaseVersionArchitectures
trixie0.8.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid0.8.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm0.8.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.8.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.8.0-3amd64,arm64,mips64el,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Sqt er en samling af kommandolinjeværktøjer til arbejdet med sekvensdata med høj gennemløb. Er i konceptet ikke låst til et bestemt sprog, mange sqt-underkommandoer er i øjeblikket implementeret i Python. For dem er en Pythonpakke tilgængelig med funktioner til at læse og skrive FASTA/FASTQ-filer, beregne sammenligninger, kvalitetstilpasning etc.

De følgende værktøjer tilbydes:

  • sqt-coverage - beregn per reference-statistik såsom dækning og GC- indhold
  • sqt-fastqmod - FASTQ-ændringer: forkort, undersæt, omvendt komplement, kvalitetstilpasning
  • sqt-fastastats - beregn N50, min/maks længde, GC-indhold etc. for en FASTA-fil
  • sqt-qualityguess - gæt kvalitetskodning for en eller flere FASTA-filer
  • sqt-globalalign - beregn en global eller semiglobal sammenligning af to strenge
  • sqt-chars - tæl længden af det første ord på kommandolinjen
  • sqt-sam-cscq - tilføj CS- og CQ-mærker til en SAM-fil med farverumslæsninger
  • sqt-fastamutate - tilføj erstatninger og indels til sekvenser i en FASTA-fil
  • sqt-fastaextract - udtræk effektivt en eller flere regioner fra en indekseret FASTA-fil
  • sqt-translate - erstat tegn i FASTA-filer (som kommandoen »tr«)
  • sqt-sam-fixn - erstat alle ikke-ACGT-tegn i læsninger i en SAM-fil
  • sqt-sam-insertsize - gennemsnit og standard and standardafvigelse for paired-end insert-størrelser
  • sqt-sam-set-op - Set-operationer (union, intersection, ...) på SAM/BAM-filer
  • sqt-bam-eof - kontroller for End-Of-File-markeringen i komprimerede BAM-filer
  • sqt-checkfastqpe - kontroller om to FASTQ-filer indeholder korrekte parrede paired-end data.
Registry entries: Bioconda 
q2cli
Klikbaseret kommandolinjegrænseflade for QIIME 2
Versions of package q2cli
ReleaseVersionArchitectures
bookworm2022.11.1-2all
trixie2022.11.1-2all
bullseye2020.11.1-1all
sid2024.2.0-1all
Popcon: 32 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 er en funktionsrig og decentraliseret mikrobiome analysepakke med fokus på data og analysegennemsigtighed. QIME 2 gør det muligt for forskere at starte en analyse med rå DNA-sekvensdata og afslutte med figurer og statistiske resultater i udgivelseskvalitet. Nøglefunktioner:

  • Integreret og automatisk registrering af dataherkomst
  • Semantisk typesystem
  • Udvidelsesmodulsystem for udvidelse af mikrobiome analysefunktionalitet
  • Understøttelse for flere typer af brugerflader (f.eks. API, kommandolinjen, grafisk)

QIIME 2 er et fuldstændigt nyt design og omskrivning af QIIME 1 mikrobiome analysedatakanalen. QIIME 2 vil adressere mange af begrænsningerne i QIIME 1, men de funktioner der gør QIIME 1 til en funktionsrig og bredt anvendt analysedatakanal bevares.

QIIME 2 understøtter i øjeblikket en oprindelig start til slut-mikrobiome analysedatakanal. Ny funktionalitet vil blive tilgængelig via QIIME 2-udvidelsesmoduler. Du kan se en liste over tilgængelige udvidelsesmoduler på QIIME 2's side over udvidelsesmoduler. »future«-siden viser udvidelsesmoduler under udvikling.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
qcumber
Kvalitetskontrol af genomsekvenser
Versions of package qcumber
ReleaseVersionArchitectures
buster1.0.14+dfsg-1all
sid2.3.0-2all
bookworm2.3.0-2all
bullseye2.3.0-2all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

QCPipeline er et værktøj til kvalitetskontrol. Arbejdsforløbet er som i det følgende:

 1. Kvalitetskontrol med FastQC
 2. Ryd op i læsninger med Trimmomatic
 3. Kvalitetskontrol af læsningerne med FastQC
 4. Oversæt læsninger mod reference via bowtie2
 5. Klassificer læsninger med Kraken
Registry entries: Bioconda 
qiime
Kvantitativ indsigt i mikrobiel økologi
Versions of package qiime
ReleaseVersionArchitectures
jessie1.8.0+dfsg-4amd64,armel,armhf,i386
sid2024.2.0-1all
bookworm2022.11.1-2all
bullseye2020.11.1-1all
trixie2024.2.0-1all
Debtags of package qiime:
roleprogram
Popcon: 30 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Mikrober omgiver os, dyr, planter og alle deres parasitter med stærk effekt på dem og det miljø, de lever i. Der tænkes på jordkvalitet men også effekten som bakterier har på hinanden. Mennesker influerer den absolutte og relative udbredelse af bakterier med antibiotika, mad, gødning - og meget andet - og disse ændringer påvirker os.

QIIME 2 er en funktionsrig og decentraliseret mikrobiome analysepakke med fokus på data og analysegennemsigtighed. QIME 2 gør det muligt for forskere at starte en analyse med rå DNA-sekvensdata og afslutte med figurer og statistiske resultater i udgivelseskvalitet. Nøglefunktioner:

  • Integreret og automatisk registrering af dataherkomst
  • Semantisk typesystem
  • Udvidelsesmodulsystem for udvidelse af mikrobiome analysefunktionalitet
  • Understøttelse for flere typer af brugerflader (f.eks. API, kommandolinjen, grafisk)

QIIME 2 er et fuldstændigt nyt design og omskrivning af QIIME 1 mikrobiome analysedatakanalen. QIIME 2 vil adressere mange af begrænsningerne i QIIME 1, men de funktioner der gør QIIME 1 til en funktionsrig og bredt anvendt analysedatakanal bevares.

QIIME 2 understøtter i øjeblikket en oprindelig start til slut-mikrobiome analysedatakanal. Ny funktionalitet vil blive tilgængelig via QIIME 2-udvidelsesmoduler. Du kan se en liste over tilgængelige udvidelsesmoduler på QIIME 2's side over udvidelsesmoduler. »future«-siden viser udvidelsesmoduler under udvikling.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (PubMed,eprint) Nature Biotechnology 37:852 - 857 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
quorum
QUality Optimized Reads of genomic sequences
Versions of package quorum
ReleaseVersionArchitectures
bookworm1.1.1-7amd64,arm64,mips64el,ppc64el
buster1.1.1-2amd64,arm64,mips64el,ppc64el
bullseye1.1.1-4amd64,arm64,mips64el,ppc64el
trixie1.1.2-2amd64,arm64,mips64el,ppc64el
sid1.1.2-2amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

QuorUM giver mulighed for at opnå trimmede og fejlkorrigerede læsninger, der resulterer i samlinger med længere contigs og færre fejl. QuorUM giver bedst ydeevne sammenlignet med andre offentliggjorte fejlkorrektorer i flere målinger. QuorUM implementeres effektivt ved at benytte nuværende multi-kerne beregningsarkitekturer, og den er velegnet til store datasæt (1 milliarder baser kontrolleres og korrigeres pr. dag pr. kerne). Tredjepartsassembleren (SOAPdenovo) har signifikant fordel af at bruge QuorUM-fejlkorrigerede læsninger. QuorUM-fejlkorrigerede læsninger resulterer i en faktor på 1,1 til 4 i forbedring i N50-contigstørrelse sammenlignet med de oprindelige læsninger med SOAPdenovo for de undersøgte datasæt.

Please cite: Guillaume Marçais, James A. Yorke and Aleksey Zimin: QuorUM: An Error Corrector for Illumina Reads. (PubMed,eprint) PLoS One 10(6):e0130821 (2015)
Registry entries: SciCrunch 
r-bioc-deseq2
R-pakke for RNS-Seq-differentiel udtryksanalyse
Versions of package r-bioc-deseq2
ReleaseVersionArchitectures
bullseye1.30.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.38.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.42.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.42.0+dfsg-1armel,armhf
sid1.42.1+dfsg-1amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
buster1.22.2+dfsg-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.14.1-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 15 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Differentiel genekspressionsanalyse baseret på den negative binomiale fordeling. Skønnet varians-middelafhængighed i antalsdata fra sekvenseringsanalyser med høj kapacitet og test for differentiel udtryk baseret på en model, der bruger den negative binomiale fordeling.

Please cite: Michael I Love, Wolfgang Huber and Simon Anders: Moderated estimation of fold change and dispersion for {RNA}-seq data with {DESeq}2. (eprint) Genome Biol 15(12) (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-edger
Empirisk analyse af digitale gen-udtryksdata i R
Versions of package r-bioc-edger
ReleaseVersionArchitectures
bullseye3.32.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.0.16+dfsg-1amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
sid4.0.15+dfsg-1armel,armhf
jessie3.8.2+dfsg-1amd64,armel,armhf,i386
stretch3.14.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie4.0.15+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.40.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 16 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Biokonduktor-pakke til differentieret udtryksanalyse af hel transskriptom- sekventering (RNA-seq) og digitale gen-udtryksprofiler med biologisk replikation. Det bruger empirisk Bayes-estimering og præcise test baseret på den negative binomial-fordelingsdistribution. Det er også nyttigt for differentieret signal-analyse med andre typer optællinger af genom-skala.

Please cite: Mark D. Robinson, Davis J. McCarthy and Gordon K. Smyth: edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. (PubMed,eprint) Bioinformatics 26,:139-140 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-hilbertvis
GNU R-pakke til at visualisere lange vektordata
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.60.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.56.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.24.0-1amd64,armel,armhf,i386
bullseye1.48.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.60.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.40.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 5 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Dette værktøj giver dig mulighed for at vise meget lange datavektorer på en pladseffektiv måde, ved at organisere dataene via en 2D-Hilbertkurve. Brugeren kan så visuelt bedømme den store skalastruktur og distribution af funktioner på samme tid via den rå form og intensiteten for individuelle funktioner.

I bioinformatics er et typisk brugstilfælde ChIP-Chip og ChIP-Seq, eller grundlæggende alle slags genomdata, som passende vises som kvantitative spor (»wiggle data«) i genombrowsere såsom dem tilbudt af Ensembl eller UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-metagenomeseq
GNU R-statistisk analyse for tynd høj-gennemløb sekventering
Versions of package r-bioc-metagenomeseq
ReleaseVersionArchitectures
buster1.24.1-1all
trixie1.43.0-2all
stretch1.16.0-2all
bookworm1.40.0-1all
bullseye1.32.0-1all
sid1.43.0-2all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

MetagenomeSeq er designet til at bestemme funktioner (det være Operational Taxanomic Unit (OTU), arter, etc.) der er differentieret rigeligt mellem to eller flere grupper af flere prøver. MetagenomeSeq er designet til at adressere effekterne af både normalisering og under-sampling af mikrobielle samfund for registrering af sygdomsassociation og test af funktionskorrelationer.

Registry entries: Bio.tools  Bioconda 
r-bioc-rsubread
Subread Sequence Alignment and Counting for R
Versions of package r-bioc-rsubread
ReleaseVersionArchitectures
bookworm2.12.2-1amd64,arm64,mips64el,ppc64el,s390x
sid2.16.1-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie2.16.1-1amd64,arm64,mips64el,ppc64el,s390x
bullseye2.4.2-1amd64,arm64,mips64el,ppc64el,s390x
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Alignment, quantification and analysis of second and third generation sequencing data. Includes functionality for read mapping, read counting, SNP calling, structural variant detection and gene fusion discovery.

Can be applied to all major sequencing techologies and to both short and long sequence reads.

Please cite: Yang Liao, Gordon K Smyth and Wei Shi: The R package Rsubread is easier, faster, cheaper and better for alignment and quantification of RNA sequencing reads,. (eprint) Nucleic Acids Research 47(8):e47 (2019)
Registry entries: Bio.tools  Bioconda 
r-cran-alakazam
Immunoglobulin Clonal Lineage and Diversity Analysis
Versions of package r-cran-alakazam
ReleaseVersionArchitectures
buster0.2.11-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.3.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.3.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Alakazam is part of the Immcantation analysis framework for Adaptive Immune Receptor Repertoire sequencing (AIRR-seq) and provides a set of tools to investigate lymphocyte receptor clonal lineages, diversity, gene usage, and other repertoire level properties, with a focus on high-throughput immunoglobulin (Ig) sequencing.

Alakazam serves five main purposes:

  • Providing core functionality for other R packages in the Immcantation framework. This includes common tasks such as file I/O, basic DNA sequence manipulation, and interacting with V(D)J segment and gene annotations.
  • Providing an R interface for interacting with the output of the pRESTO and Change-O tool suites.
  • Performing lineage reconstruction on clonal populations of Ig sequences and analyzing the topology of the resultant lineage trees.
  • Performing clonal abundance and diversity analysis on lymphocyte repertoires.
  • Performing physicochemical property analyses of lymphocyte receptor sequences.
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31(20):3356–3358 (2017)
r-cran-shazam
Immunoglobulin somatisk hypermutationsanalyse
Versions of package r-cran-shazam
ReleaseVersionArchitectures
bookworm1.1.2-1all
bullseye1.0.2-1all
sid1.2.0-1all
buster0.1.11-1all
trixie1.2.0-1all
Popcon: 5 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Denne pakke tilbyder en beregningsramme for bayesiansk estimering af antigen-drevet valg i immunglobulin-sekvenser (Ig), der tilbyder en intuitiv måde at analysere valg ved at kvantificere graden af selektiv pres. Tilbyder også værktøjer til at profilere mutationer i Ig-sekvenser, bygge modeller med somatisk hypermutation (SHM) i Qg-sekvenser og fremstille modelafhængige afstandssammenligninger af Ig-arkiver.

SHazaM er en del af analyserammen Immacantation for Adaptive Immune Receptor Repertoire-sekventering (AIRR-seq) og tilbyder værktøjer for avanceret analyse af somatisk hypermutation (SHM) i immunoglobulin-sekvenser (Ig). Shazam fokuserer på de følgende analyseemner:

  • Kvantifikation af mutational indlæsning
  • Statistiske modeller for SHM-målrettede mønstre
  • Analyse af valgpres via BASELINe
  • Modelafhængig afstandsberegninger
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data.. (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: Bioconda 
r-cran-tcr
Avanceret dataanalyse af Immune Receptor Repertoires
Versions of package r-cran-tcr
ReleaseVersionArchitectures
buster2.2.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Celler i immunsystemet er den store undtagelse til reglen om, at alle celler for et individ har (næste præcise) kopier af den samme DNA. B-celler (der fremstiller antistoffer) og T-celler (der kommunikerer med celler) har en sektion af deres DNA med gener for grupperen V, D og J, der er omorganiseret i genom-DNA'et for at tilbyde fleksibilitet til at håndtere endnu ukendte bakterier.

Denne pakke tilbyder en platform for avanceret analyse af T-celle-receptor repertoire-data og deres visualiseringer.

Bemærk: Denne pakke bliver snart erstattet af http://github.com/immunomind/immunarch, der endnu ikke er tilgængelig som en Debianpakke.

Please cite: Vadim I. Nazarov, Mikhail V. Pogorelyy, Ekaterina A. Komech, Ivan V. Zvyagin, Dmitry A. Bolotin, Mikhail Shugay, Dmitry M. Chudakov, Yury B. Lebedev and Ilgar Z. Mamedov: tcR: an R package for T cell receptor repertoire advanced data analysis. (eprint) BMC Bioinformatics 16:175 (2015)
Registry entries: Bio.tools  Bioconda 
r-cran-tigger
Udleder nye immunoglobulin-alleler fra Rep-Seq-data
Versions of package r-cran-tigger
ReleaseVersionArchitectures
bullseye1.0.0-1all
buster0.3.1-1all
sid1.1.0-1all
trixie1.1.0-1all
bookworm1.0.1-1all
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Sammenfatning: Udleder V-genotypen af et individ fra immunglobulin (Ig) repertoire-sekventeringsdata (Rep-Seq), herunder påvisning af enhver begyndende allel. Denne information bruges derefter til at rette eksisterende V-allelkald blandt prøvesekvenserne.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31(20):3356–3358 (2017)
Registry entries: Bioconda 
rna-star
Ultrahurtig univerel RNA-seq-sammenligningsprogram
Versions of package rna-star
ReleaseVersionArchitectures
buster2.7.0a+dfsg-1amd64,arm64,mips64el,ppc64el
trixie2.7.11b+dfsg-1amd64,arm64,mips64el,ppc64el
stretch2.5.2b+dfsg-1amd64,arm64,mips64el,ppc64el
bookworm2.7.10b+dfsg-2amd64,arm64,mips64el,ppc64el
bullseye2.7.8a+dfsg-2amd64,arm64,mips64el,ppc64el
stretch-backports2.7.0a+dfsg-1~bpo9+1amd64,arm64,mips64el,ppc64el
sid2.7.11b+dfsg-1amd64,arm64,mips64el,ppc64el
Popcon: 7 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Programmet Spliced Transcripts Alignment to a Reference (STAR) baseret på en tidligere ubeskrevet RNA-seq-sammenligningsalgoritme, som bruger sekventiel maksimal kortlægningsparat seed-søgning i suffikstabeller uden komprimering efterfulgt af seed-klyngeopbygning og syning. STAR er bedre end andre sammenligningsprogrammer med en faktor >50 i kortlægningshastighed, sammenligning med menneskets genom 550 million 2 × 76 bp parret-slut læsninger per time på en moderat server med 12-kerner, mens der på samme tid er en forbedring af sammenligningssensitivitet og præcision. Udover fordomsfri de novo-registrering af kanoniske bindinger kan STAR registrere ikkekanoniske dele og chimeric (fusion) transkriptioner, og kan også oversætte RNA-sekvenser i fuld længde. Via Rocke 454-sekvensering af »reverse transcription polymerase chain reaction amplicons« validerede forfatterne eksperimentelt 1960 novel mellemgenom delbindinger med 80-90 % succes, underbyggende den høje præcision i START-kortlægningsstrategien.

The package is enhanced by the following packages: multiqc
Please cite: Alexander Dobin, Carrie A. Davis, Felix Schlesinger, Jorg Drenkow, Chris Zaleski, Sonali Jha, Philippe Batut, Mark Chaisson and Thomas R. Gingeras: STAR: ultrafast universal RNA-seq aligner. (PubMed,eprint) Bioinformatics 29(1):15-21 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
rtax
Klassifikation af sekvenslæsninger for 165 ribosomal RNA-gen
Versions of package rtax
ReleaseVersionArchitectures
buster0.984-6all
stretch0.984-5all
jessie0.984-2all
sid0.984-8all
trixie0.984-8all
bookworm0.984-8all
bullseye0.984-7all
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Short-read-teknologier for mikrobiel fællesskabsprofilering øges i popularitet, men tidligere teknologier for tildeling af taksonomi til paried-end-læsninger performer dårligt. RTAX tilbyder hurtige taksonomiske tildelinger for paired-end-læsninger via en konsensusalgoritme.

Please cite: David A. W. Soergel, Neelendu Dey, Rob Knight and Steven E. Brenner: Selection of primers for optimal taxonomic classification of environmental 16S rRNA gene sequences. (PubMed,eprint) The ISME Journal 6:1440–1444 (2012)
salmon
Wicked-hurtig transskriptkvantificering fra RNA-seq-data
Versions of package salmon
ReleaseVersionArchitectures
bookworm1.10.1+ds1-1amd64,arm64
buster0.12.0+ds1-1amd64
bullseye1.4.0+ds1-1amd64,arm64
stretch0.7.2+ds1-2amd64
trixie1.10.2+ds1-1amd64,arm64
sid1.10.2+ds1-1amd64,arm64
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Salmon er et wicked-hurtigt program til at producere et meget præcist transkriptionsniveau for kvantificeringsestimater fra RNA-seq-data. Salmon opnår nøjagtighed og hastighed via en række forskellige innovationer, herunder brug af simple justeringer (nøjagtige men hurtige til at beregne proxyer til traditionel læsningssammenligninger) og massivt parallelt stokastisk sammenbrudt variationsinferens. Resultatet er et alsidigt værktøj, som passer fint ind i mange forskellige datakanaler. For eksempel kan du vælge at gøre brug af simple justeringer af at give Salmon

 rå sekventeringslæsninger, eller hvis det er mere praktisk kan du give
Salmon regelmæssige sammenligninger (f.eks. beregnet med din

favoritsammenligner), og det vil bruge den samme wicked-hurtige og moderne inferensalgoritme til at estimere transkriptionsniveauer for dit eksperiment.

The package is enhanced by the following packages: multiqc
Please cite: Rob Patro, Geet Duggal, Michael I Love, Rafael A Irizarry and Carl Kingsford: Salmon provides fast and bias-aware quantification of transcript expression. (eprint) Nature Methods 14(4):417-419 (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sambamba
Værktøjer for arbejde med SAM/BAM-data
Versions of package sambamba
ReleaseVersionArchitectures
trixie1.0.1+dfsg-1amd64,arm64
bookworm1.0+dfsg-1amd64,arm64
sid1.0.1+dfsg-1amd64,arm64,riscv64
bullseye0.8.0-1amd64,arm64
Popcon: 5 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Sambamba positionerer sig selv som et højtydende alternativ til samtools og tilbyder værktøjer for

  • Funktionsrig filtrering med sambamba view --filter
  • Picard-lignende SAM-teksthovedsammenføjning i værktøjet merge
  • Valgfri for operationer på hele BAM'er
  • Hurtig kopiering af en region til en ny fil med værktøjet slice
  • Duplikere markering/fjernelse, via Picardkriteriet
Please cite: Artem Tarasov, Albert J. Vilella, Edwin Cuppen, Isaac J. Nijman and Pjotr Prins: Sambamba: fast processing of NGS alignment formats. (PubMed,eprint) Bioinformatics 31(12):2032-2034 (2015)
Registry entries: Bio.tools  Bioconda 
samblaster
Markerer dubletter, udtrækker discordant/split-læsninger
Versions of package samblaster
ReleaseVersionArchitectures
trixie0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster0.1.24-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.1.26-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Nuværende »next-generation« sekventeringsteknologi kan ikke fortælle hvilken præcis sekvens de vil læse. De tager hvad der er tilgængelig. Og hvis nogle sekvenser læses meget ofte, så skal dette bruge lidt ekstra biomedicinsk tænkning. Genomet kan for eksempel blive duplikeret.

Samblaster er et hurtigt og fleksibelt program til at markere dubletter i read-id-grupperede paired-end SAM-filer. Det kan også valgfrit fremstille discordant read pairs og/eller opdele læsningsoversættelser til separate SAM-filer, og/eller unmapped/clipped læsninger til en separat FASTQ-fil. Når dubletter markeres vil samblaster kræver cirka 20 MB hukommelse per 1M læste par.

The package is enhanced by the following packages: multiqc
Please cite: Gregory G. Faust and Ira M. Hall: SAMBLASTER: fast duplicate marking and structural variant read extraction. (PubMed,eprint) Bioinformatics 30(17):2503-2505 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
samtools
Forarbejdning af sekvensopstillinger i SAM-, BAM- og CRAM-formater
Versions of package samtools
ReleaseVersionArchitectures
bookworm1.16.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.19.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
jessie0.1.19-1amd64,armhf,i386
buster1.9-4amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
trixie1.19.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 84 users (45 upd.)*
Versions and Archs
License: DFSG free
Git

Samtools er et sæt af værktøjer, der manipulerer sammenligninger af nukleotidsekvenser i det binære BAM-format. Værktøjet importerer fra og eksporterer til ascii SAM-formatet (Sequence Alignment/Map) og CRAM-formater, udfører sortering, sammenlægning og indeksering, og gør det muligt at hente læsninger i alle områder hurtigt. Det er designet til at arbejde på en strøm, og er i stand til at åbne en BAM- eller CRAM-fil (ikke SAM) på en ekstern FTP- eller HTTP-server.

The package is enhanced by the following packages: libbio-samtools-perl multiqc
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package samtools
scoary
Pangenom-brede associationsstudier
Versions of package scoary
ReleaseVersionArchitectures
bookworm1.6.16-5all
trixie1.6.16-6all
bullseye1.6.16-2all
buster1.6.16-1all
stretch-backports1.6.16-1~bpo9+1all
sid1.6.16-6all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Scoary er designet til at anvende gene_presence_absence.csv-filen fra Roary samt som en traits-fil oprettet af brugeren og beregne associationerne mellem alle gener i accessory-genet og egenskaberne. Den rapporterer en liste over gener sorteret efter styrke på association per egenskab.

Please cite: Ola Brynildsrud, Jon Bohlin, Lonneke Scheffer and Vegard Eldholm: Rapid scoring of genes in microbial pan-genome-wide association studies with Scoary. (PubMed,eprint) Genome Biology 17(238) (2016)
Registry entries: Bio.tools  Bioconda 
scythe
Byesiansk adaptortrimmer for sekvenslæsninger
Versions of package scythe
ReleaseVersionArchitectures
trixie0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch0.994-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.994+git20141017.20d3cff-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Scythe bruger en naiv bayesiansk fremgangsmåde til at klassificere forurenende understrenge i sekvenslæsninger. Den kigger på kvalitetsinformation, hvilket kan gøre den robust i udvælgelse af 3'-end adaptere, som ofte inkluderer baser i dårlig kvalitet.

Registry entries: SciCrunch 
seqprep
Strippe adaptere og/eller sammenføjede parrede læsninger af DNA-sekvenser med overlap
Versions of package seqprep
ReleaseVersionArchitectures
bullseye1.3.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.3.2-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.3.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.3.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.3.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SeqPrep er et program til at sammenlægge parrede Illuminalæsninger, der overlapper hinanden ind i en enkelt længere læsning. Det kan også bruges til sin adaptertilpasningsfunktion uden at udføre nogen parrede slut-overlapninger. Når en adaptersekvens er nuværende, det betyder, at de to læsninger skal overlappe (i de fleste tilfælde) så de er kraftigt fusioneret. Når læsninger ikke har adaptersekvens, skal de behandles omhyggeligt, når man laver sammenføjningen, så en langt mere specifik fremgangsmåde er valgt. Standardparametrene blev valgt med tanke på specificitet, så at de kunne køres på biblioteker, hvor meget få læsninger forventes at overlappe hinanden. Det er dog altid sikreste at gemme den overlappende procedure for biblioteker, hvor du har forudgående kendskab til, at en væsentlig del af læsningerne vil have overlapning.

Registry entries: Bio.tools  SciCrunch  Bioconda 
seqtk
Hurtigt letvægtsværktøj til behandling af sekvenser i formaterne FASTA eller FASTQ
Versions of package seqtk
ReleaseVersionArchitectures
jessie1.0-1amd64,armel,armhf,i386
bullseye1.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 9 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

I øjeblikket understøtter seqtk en kvalitetsbaseret justering med algoritmen phred, konvertering fra fastq til fasta, komplementering af omvendte sekvenser, udpakning eller maskering af delsekvender i regioner, der stammer fra en BED/navneliste-fil, og mere. Den indeholder et modul til at indsamle delvise prøver, der indsamler eksakt n sekvenser eller en fraktion af sekvenser.

Seqtk understøtter både inddatafiler af typen fasta og fastq, der valgfrit kan komprimeres med gzip.

Registry entries: Bio.tools  Bioconda 
Screenshots of package seqtk
sga
De novo-genomsamler som bruger strenggrafer
Versions of package sga
ReleaseVersionArchitectures
bookworm0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch0.10.15-2amd64,arm64,mips64el,ppc64el
trixie0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el
buster0.10.15-4amd64,arm64,mips64el,ppc64el
bullseye0.10.15-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Hovedformålet med SGA er at være meget hukommelseseffektivt, hvilket opnås ved at bruge en komprimeret repræsentation af DNA-sekvenslæsninger.

SGA er en novo-samler for DNS-sekvenslæsninger. Programmet er baseret på Gene Myers' strenggrafformulation af samling og bruger FM-index/Burrows-Wheeler-transform til effektivt at finde overlapninger mellem sekvenslæsninger.

Please cite: Jared T. Simpson and Richard Durbin: Efficient de novo assembly of large genomes using compressed data structures.. (PubMed,eprint) Genome Res 22(3):549-555 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sickle
Vinduesopdelt adaptiv trimmingværktøj for FASTQ-filer der bruger kvalitet
Versions of package sickle
ReleaseVersionArchitectures
bookworm1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.33-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.33+git20150314.f3d6ae3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

De fleste moderne sekventeringsteknologier fremstiller læsninger, som har lavere kvalitet mod 3'.end. Ukorrekte kaldte baser her påvirker negativt samlinger, oversættelse og bioinformatik-analyser.

Sickle er et værktøj, som bruger glidende vinduer sammen med kvalitets- og længdetærskler til at bestemme når kvaliteten er tilstrækkelig lav til at trimme 3'-end af læsninger. Programmet vil også fjerne læsninger baseret på længdens tærskel. Værktøjet bruger kvalitetsværdierne og glider et vindue på tværs af dem hvis længde er 0,1 gange længden af læsningen. Hvis denne længde er mindre end 1, så sættes vinduet til længden på læsningen. Elles glider vinduet langs kvalitetsværdierne indtil den gennemsnitlige kvalitet i vinduet er under tærsklen. På dette tidspunkt bestemmer algoritmen hvor i vinduet tabet opstår og klipper både læsningen og kvalitetsstrengene der. Hvis klip-punktet er mindre end minimumslængdens tærskel, så fjernes læsningen helt.

Sickle understøtter fire typer af kvalitetsværdier: Illumina, Solexa, Phred og Sanger. Bemærk at kvalitetsindstillingen Solexa er en tilnærmelse (den faktiske konvertering er en ikkelineær transformation). Sluttilnærmelsen er luk.

Sickle understøtter også filer pakket med gzip.

The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
smalt
Værktøj til sekvensoversættelse og sammenligning
Versions of package smalt
ReleaseVersionArchitectures
bullseye0.7.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.7.6-8amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
jessie0.7.6-4amd64,armhf,i386
stretch0.7.6-6amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
sid0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.7.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SMALT sammenligner effektivt DNA-sekvenslæsninger med et referencegenom. Læsninger fra en bred vifte af sekvensplatforme, for eksempel Illunina, Roche-454, Ion Torrent, PacBio eller ABI-Sanger, kan behandles inklusive parrede læsninger.

Programmet anvender et perfekt hashindeks med korte ord (<20 nukleotider lang), samplet ved ækvivalente trin langs genomreferencesekvenser.

For hver læsning bliver potentielt matchende segmenter i referencen identificeret fra seed-matchninger i indekset og efterfølgende sammenlignet med læsningen via en forbundet Smith-Waterman-algoritme.

Den bedste sammenligning af hver læsning rapporteres inklusive en bedømmelse af troværdighed for bedste oversættelse. Brugeren kan justere balancen mellem sensitivitet og hastighed ved at finjustere længden og mellemrum for hashede ord.

En tilstand for registrering af split-læsninger (chimeric) tilbydes. Programkørsel med flere tråde er også understøttet.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: This can be regarded as successor of ssaha2

This program is from the same author as ssaha2 and according to its author faster and more precise than ssaha2 (except for sequences > 2000bp).

smrtanalysis
Programpakke for enkel molekyle, realtids sekventering
Versions of package smrtanalysis
ReleaseVersionArchitectures
stretch0~20161126all
bullseye0~20210111all
bookworm0~20210112all
sid0~20210112all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

SMRT®-analyse er en funktionsrig programpakke indenfor bioinformatik udviklet i åben kildekode og tilgængelig for analyse af DNA- sekventeringsdata fra Pacific Biosciences' SMRT-teknologi. Brugere kan vælge blandt en række analyseprotokoller, som udnytter PacBio® og tredjepartsværktøjer. Analyseprotokoller inkluderer de novo-genomsamling, cDNA-oversættelse, DNA base-ændringsregistrering og lang-amplicon analyse til at bestemme fasede konsensussekvenser.

Dette er en metapakke, som afhænger af komponenterne for SMRT Analysis.

Registry entries: Bio.tools  SciCrunch 
snap-aligner
Scalable Nucleotide Alignment Program
Versions of package snap-aligner
ReleaseVersionArchitectures
buster1.0~beta.18+dfsg-3amd64,arm64,mips64el,ppc64el
bookworm2.0.2+dfsg-1amd64,arm64,mips64el,ppc64el
bullseye1.0.0+dfsg-2amd64,arm64,mips64el,ppc64el
trixie2.0.3+dfsg-2amd64,arm64,mips64el,ppc64el
sid2.0.3+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
stretch1.0~beta.18+dfsg-1amd64,arm64,mips64el,ppc64el
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SNAP er en ny sekvenssammenligner, som er 3-20 gange hurtigere og lige så præcis som eksisterende værktøjer såsom BWA-mem, Bowtie2 og Novoalign. Programmer kan afvikles på gængse x86-processorer og understøtter en rig fejlmodel, som gør at den billigt kan matche læsninger med flere forskelle fra referencen end andre værktøjer. Dette giver SNAP op til 2 gange lavere fejlrate end eksisterende værktøjer (i nogle tilfælde) og lader dig matche større mutationer, som de måske mangler. SNAP læser også BAM, FASTQ eller gzippet FASTQ og skriver SAM eller BAM, med indbygget sortering, dublet markering og BAM-indeks.

Please cite: Matei Zaharia, William J. Bolosky, Kristal Curtis, Armando Fox, David Patterson, Scott Shenker, Ion Stoica, Richard M. Karp and Taylor Sittler: Faster and More Accurate Sequence Alignment with SNAP. (eprint) arXiv preprint arXiv:1111.5572 (2011)
Registry entries: SciCrunch 
sniffles
Strukturel variationskalder der bruger tredjegenerations sekventering
Versions of package sniffles
ReleaseVersionArchitectures
bookworm2.0.7-1all
bullseye1.0.12b+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.11+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.2+ds-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.2-1all
trixie2.2-1all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Sniffles er en strukturel variationskalder (SV), der bruger tredjegenerations sekventeringsdata såsom dem fra Pacific Biosciences- eller Oxford Nanopore-platforme. Programmet registrerer alle typer af SV'er via bevis fra delt-læst sammenligninger, høj mismatch regioner og dækningsanalyse.

Please cite: Fritz J. Sedlazeck, Philipp Rescheneder, Moritz Smolka, Han Fang, Maria Nattestad, Arndt von Haeseler and Michael Schatz: Accurate detection of complex structural variations using single molecule sequencing. (eprint) bioRxiv (2017)
Registry entries: Bio.tools  Bioconda 
snp-sites
Binær kode for pakken snp-sites
Versions of package snp-sites
ReleaseVersionArchitectures
jessie1.5.0-1amd64,armel,armhf,i386
stretch2.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.5.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Dette program finder single nucleotide polymorphism-sider (SNP) fra multi-fasta sammenligningsfiler (som kan være komprimerede). Dets resultat kan være i forskellige formater (Multi Fasta Alignment, Vcf, phylip).

Programmet er blevet udviklet på Wellcome Trust Sanger Institute.

En enkel nukleotid - polymorfi (SNP, udtalt snip; flertal snips) er en DNA-sekvensvariation, der opstår når en Single Nucleotide — A, T, C eller G — i genomet (eller en anden delt sekvens) er forskellig fra medlemmer af en biologisk art eller parrede kromosomer. For eksempel: To sekventerede DNA-fragmenter fra forskellige individer, AAGCCTA til AAGCTTA, indeholder en forskel i en enkel nukleotid. I dette tilfælde er der to alleler. Næsten alle fælles SNP'er har kun to alleler.

Please cite: Andrew J. Page, Ben Taylor, Aidan J. Delaney, Jorge Soares, Torsten Seemann, Jacqueline A. Keane and Simon R. Harris: SNP-sites: rapid efficient extraction of SNPs from multi-FASTA alignments. (eprint) Microbial Genomics 2(4) (2016)
Topics: Genetic variation
Screenshots of package snp-sites
snpomatic
Hurtig, stringent kort-læsning oversættelsesprogram
Versions of package snpomatic
ReleaseVersionArchitectures
trixie1.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Sekvensteknologier med høj gennemløb opretter store mængder af korte læsninger. Oversættelse af disse til en referencesekvens forbruger store mængder af behandlingstid og hukommelse, og læste oversættelsesfejl kan føre til støj eller ukorrekte sammenligninger.

SNP-o-matic er et hurtigt, stringent kort-læsning oversættelsesprogram. Det understøtter en mængde af uddatatyper og formater, for brug i filtrering, sammenligninger, sekvensbaseret genotypekald, assisteret nysamling af contigs etc.

Please cite: Heinrich Magnus Manske and Dominic P. Kwiatkowski: SNP-o-matic. (PubMed,eprint) Bioinformatics 25(18):2434-2435 (2009)
Registry entries: Bio.tools  Bioconda 
Topics: Genetic variation; Mapping
soapdenovo
Short-read samlingsmetode til at bygge de novo-kladdesamling
Versions of package soapdenovo
ReleaseVersionArchitectures
sid1.05-6amd64
jessie1.05-2amd64
stretch1.05-3amd64
buster1.05-5amd64
bullseye1.05-6amd64
bookworm1.05-6amd64
trixie1.05-6amd64
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo er en lille short-read samlingsmetode, som kan bygge en de novo-kladdesamling for arvemassen i menneskestørrelse. Programmet er specielt designet til at samle »Illumina GA short reads«.

Programmet skaber nye muligheder for bygning af referencesekvenser og udføre præcise analyser af ej opdaget arvemasse på en omkostningseffektiv måde.

Denne version vedligeholdes ikke længere, overvej at bruge soapdenovo2.

Please cite: Ruiqiang Li, Hongmei Zhu, Jue Ruan, Wubin Qian, Xiaodong Fang, Zhongbin Shi, Yingrui Li, Shengting Li, Gao Shan, Karsten Kristiansen, Songgang Li, Huanming Yang, Jian Wang and Jun Wang: De novo assembly of human genomes with massively parallel short read sequencing. (PubMed,eprint) Genome Research 20(2):265-72 (2009)
Registry entries: Bio.tools  SciCrunch 
soapdenovo2
Short-read samlingsmetode til at bygge de novo-kladdesamling
Versions of package soapdenovo2
ReleaseVersionArchitectures
jessie240+dfsg-2amd64
stretch240+dfsg1-2amd64
buster241+dfsg-3amd64
bullseye242+dfsg-1amd64
bookworm242+dfsg-3amd64
trixie242+dfsg-3amd64
sid242+dfsg-3amd64
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo er en lille short-read samlingsmetode, som kan bygge en de novo-kladdesamling for arvemassen i menneskestørrelse. Programmet er specielt designet til at samle »Illumina GA short reads«.

Programmet skaber nye muligheder for bygning af referencesekvenser og udføre præcise analyser af ej opdaget arvemasse på en omkostningseffektiv måde.

Please cite: Ruibang Luo, Binghang Liu, Yinlong Xie, Zhenyu Li, Weihua Huang, Jianying Yuan, Guangzhu He, Yanxiang Chen, Qi Pan, Yunjie Liu, Jingbo Tang, Gengxiong Wu, Hao Zhang, Yujian Shi, Yong Liu, Chang Yu, Bo Wang, Yao Lu, Changlei Han, David W Cheung, Siu-Ming Yiu, Shaoliang Peng, Zhu Xiaoqian, Guangming Liu, Xiangke Liao, Yingrui Li, Huanming Yang, Jian Wang, Tak-Wah Lam and Jun Wang: SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. Giga Science 1(1):18 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sortmerna
Værktøj til at filtrere, oversætte og OTU-udvælge NGS-læsninger
Versions of package sortmerna
ReleaseVersionArchitectures
stretch2.1-1amd64,i386
sid4.3.6-3amd64,i386
trixie4.3.6-3amd64,i386
bookworm4.3.6-2amd64,i386
buster2.1-3amd64,i386
bullseye2.1-5amd64,i386
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SortMerNA er et biologisk sekvensanalyseværktøj til at filtrere, oversætte og OTU-udvælge NGS-læsninger. Grundalgoritmen er baseret på tilnærmede seeds og muliggør hurtige og følsomme analyser af nukleotidsekvenser. Den vigtigste anvendelse af SortMeRNA er filtrering af rRNA fra metatranscriptomiske data. Yderligere applikationer omfatter OTU-plukning og taksonomitildeling til rådighed gennem QIIME v1.9+ (http://qiime.org - v1.9.0-rc1). SortMeRNA bruger som inddata en fil med læsninger (fasta- eller fastq- format) og en eller flere rRNA-databasefiler og sorterer rRNA og afviste læsninger væk i to filer specificeret af brugeren. Eventuelt kan det give lokale sammenligninger i høj kvalitet af rRNA-læsninger mod rRNA-databasen. SortMeRNA fungerer med Illumina-, 454-, Ion Torrent- og PacBio-data og kan fremstille SAM- og BLAST-lignende sammenligninger.

The package is enhanced by the following packages: multiqc
Please cite: Evguenia Kopylova, Laurent Noé and Hélène Touzet: SortMeRNA: fast and accurate filtering of ribosomal RNAs in metatranscriptomic data". (PubMed,eprint) Bioinformatics 28(24):3211-3217 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
spades
Genomsamler for single-celle- og isolates-datasæt
Versions of package spades
ReleaseVersionArchitectures
buster3.13.0+dfsg2-2amd64
stretch-backports3.12.0+dfsg-1~bpo9+1amd64
stretch3.9.1+dfsg-1amd64
sid3.15.5+dfsg-7amd64
trixie3.15.5+dfsg-7amd64
bookworm3.15.5+dfsg-2amd64
bullseye3.13.1+dfsg-2amd64
stretch-backports-sloppy3.13.1+dfsg-2~bpo9+1amd64
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

SPAdes - St. Petersburg-genomsamleren er lavet for både isolates- og single-celle MDA-bateriesamlinger. Den fungerer med Illumina- eller IonTorrent-læsninger og kan tilbyde hybride samlinger, der bruger PacBio- og Sangerlæsninger. Du kan også tilbyde yderligere contigs, som vil blive brugt som lange læsninger.

Denne pakke tilbyder de følgende yderligere datakanaler:

  • metaSPAdes – en datakanal for metagenomiske datasæt
  • plasmidSPAdes – en datakanal til at udtrække og samle plasmids fra WGS-datasæt
  • metaplasmidSPAdes – en datakanal til at udtrække og samle plasmids fra metagenomiske datasæt
  • rnaSPAdes – en de novo transkriptom-samler fra RNA-Seq-data
  • truSPAdes – et modul for TruSeq-stregkodesamling
  • biosyntheticSPAdes – et modul for biosyntetisk genklyngesamling med paired-end læsninger

SPAdes tilbyder flere uafhængige binære filer med en relativ simpel kommandolinjegrænseflade: optælling af k-mer (spades-kmercounter), grafkonstruktion over samling (spades-gbuilder) og en lang læsning til grafsammenligning (spades-gmapper).

Please cite: Anton Bankevich, Sergey Nurk, Dmitry Antipov, Alexey A. Gurevich, Mikhail Dvorkin, Alexander S. Kulikov, Valery M. Lesin, Sergey I. Nikolenko, Son Pham, Andrey D. Prjibelski, Alexey V. Pyshkin, Alexander V. Sirotkin, Nikolay Vyahhi, Glenn Tesler, Max A. Alekseyev and Pavel A. Pevzner: SPAdes: A New Genome Assembly Algorithm and Its Applications to Single-Cell Sequencing. (PubMed,eprint) Journal of Computational Biology 19(5):455-477 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sprai
Forbedring af single-pass-sekventeringslæsenøjagtighed
Versions of package sprai
ReleaseVersionArchitectures
stretch0.9.9.22+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.9.9.23+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Sprai er et værktøj til at rette sekventeringsfejl i single-pass- læsninger for de novo-samling. Det er oprindeligt designet for rettelse af sekventeringsfejl i enkelt molekyle DNS-sekventeringslæsninger, specielt i Continous Long Reads (CLR'er) oprettet af PacBio RS- sekvensprogrammer. Formålet med Sprai er ikke at maksimere præcisionen for fejlrettede læsninger. I stedet forsøger Sprai at maksimere kontinuiteten (dvs., N50 contig-længder) for samlede contig'er efter fejlrettelse.

sra-toolkit
Redskaber for NCBI Sequence Read Archive
Versions of package sra-toolkit
ReleaseVersionArchitectures
sid3.0.3+dfsg-6amd64,arm64
stretch2.8.1-2+dfsg-2amd64,i386
buster2.9.3+dfsg-1amd64
bullseye2.10.9+dfsg-2amd64
trixie3.0.3+dfsg-6amd64,arm64
bookworm3.0.3+dfsg-6~deb12u1amd64,arm64
jessie2.3.5-2+dfsg-1amd64,i386
upstream3.1.0
Popcon: 19 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Værktøjer til at læse SRA-arkivet, generelt ved at konvertere individuelle kørsler til et ofte anvendt format såsom fastq.

De tekstmæssige dumpere »sra-dump« og »vdb-dump« tilbydes i denne udgivelse som en hjælp til visuel inspektion. Det er sandsynligt, at den faktiske uddataformatering vil blive ændret i den nære fremtid for en mere stringent, mere formaliseret repræsentation. AFHÆNG IKKE AF UDDATAFORMATET I DENNE UDGIVELSE.

Andre værktøjer distribueret i denne pakke er:

 abi-dump, abi-load
 align-info
 bam-load
 cache-mgr
 cg-load
 copycat
 fasterq-dump
 fastq-dump, fastq-load
 helicos-load
 illumina-dump, illumina-load
 kar
 kdbmeta
 latf-load
 pacbio-load
 prefetch
 rcexplain
 remote-fuser
 sff-dump, sff-load
 sra-pileup, sra-sort, sra-stat, srapath
 srf-load
 test-sra
 vdb-config, vdb-copy, vdb-decrypt, vdb-encrypt, vdb-get, vdb-lock,
 vdb-passwd, vdb-unlock, vdb-validate

Informationen »Help« vil blive forbedret i fremtidige udgivelser og værktøjsindstillingerne vil blive standardiseret på tværs af sættet. Yderligere dokumentation vil også blive lagt på NCBI-hjemmesiden.

Værktøjsindstillinger kan ændre sig i den næste udgivelse. Version 1- værktøjsindstillinger vil forblive understøttet hvor muligt for at bevare funktionaliteten på eksisterende skripter.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.tools  Bioconda 
srst2
Kort læsesekvensindtastning for bakterielle patogener
Versions of package srst2
ReleaseVersionArchitectures
sid0.2.0-11amd64,arm64,mips64el,ppc64el,riscv64
bookworm0.2.0-9amd64,arm64,mips64el,ppc64el
bullseye0.2.0-8amd64,arm64,mips64el,ppc64el
buster0.2.0-6amd64
stretch0.2.0-4amd64
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Dette program er designet til at bruge Illumina-sekvensdata, en MLST-database og/eller en database med gensekvenser (f.eks. resistente gener, virulensgener etc.) og rapportere tilstedeværelsen af ST'er og/eller referencegener.

Please cite: Michael Inouye, Harriet Dashnow, Lesley-Ann Raven, Mark B Schultz, Bernard J Pope, Takehiro Tomita, Justin Zobel and Kathryn E Holt: SRST2: Rapid genomic surveillance for public health and hospital microbiology labs. (PubMed,eprint) Genome Medicine 6(11):90 (2014)
Registry entries: Bioconda 
ssake
Genomprogram for samling af millioner af meget korte DNA-sekvenser
Versions of package ssake
ReleaseVersionArchitectures
sid4.0.1-1all
jessie3.8.2-1all
stretch3.8.4-1all
buster4.0-2all
bullseye4.0-3all
bookworm4.0.1-1all
trixie4.0.1-1all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Short Sequence Assembly af K-mer search and 3′ read Extension (SSAKE) er et genomprogram for aggressiv samling af millioner af korte nukleotidsekvenser ved gradvis at søge efter perfekte 3'-meste k-merer ved hjælp af et DNA-præfikstræ. SSAKE er designet til at hjælpe med at udnytte oplysningerne fra korte sekvenser læst ved stringent klyngeopbygning i contig'er, der kan bruges til at karakterisere nye sekventeringsmål.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
stacks
Datakanal for bygning af loci fra kort-læs DNA-sekvenser
Versions of package stacks
ReleaseVersionArchitectures
stretch1.44-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
trixie2.66+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye2.55+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.2+dfsg-1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
sid2.66+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.62+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Stacks er en programdatakanal for bygning af loci (specifik placering af et gen) fra kort-læs sekvenser, såsom dem oprettet på platformen Illumina. Stacks blev udviklet for at fungere med begrænsning af enzymbaserede data, såsom RAD-seq, med det formål at bygge genetiske kort og udføre forskning indenfor befolkningsgener og fylogeografi.

Bemærk at denne pakke installerer Stacks på en måde der gør, at alle kommandoer skal køres som: $ stacks

The package is enhanced by the following packages: multiqc
Please cite: Julian Catchen, Paul A. Hohenlohe, Susan Bassham, Angel Amores and William A. Cresko: Stacks: an analysis tool set for population genomics. (PubMed) Molecular Ecology 22(11):3124-40 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
stringtie
Saml korte RNAseq-læsninger til transkripter
Versions of package stringtie
ReleaseVersionArchitectures
bookworm2.2.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.1.4+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.2.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.2.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Mangfoldigheden af transkripter i menneskevævsprøver kan bestemmes via RNA-sekventering. Den præcise sekvens indhentet kan være vilkårlig, afhængig af anvendt teknologi. Og den kan være kort, dvs. kortere end transkripten. På et tidspunkt har mange korte læsninger brug for at samles til modellen for den fuldstændige transkript.

StringTie ved hvordan RNA-seq skal samles til potentielle transkripter uden behov for et referencegenom og tilbyder en kvantifikation af splice- varianterne.

Please cite: Mihaela Pertea, Geo M. Pertea, Corina .M. Antonescu, Tsung-Cheng Chang, Joshua T. Mendell and Steven L. Salzberg: StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology 33:290–295 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
subread
Værktøjssæt til at behandle næstegen. sekvensdata
Versions of package subread
ReleaseVersionArchitectures
buster1.6.3+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
sid2.0.6+dfsg-2amd64,arm64,armel,armhf,i386,ppc64el,riscv64
trixie2.0.6+dfsg-2amd64,arm64,armel,armhf,i386,ppc64el
bookworm2.0.3+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
bullseye2.0.1+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
buster-backports2.0.0+dfsg-1~bpo10+1amd64,arm64,armel,armhf,i386,ppc64el
stretch1.5.1+dfsg-4amd64,arm64,armel,armhf,i386,ppc64el
Popcon: 7 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Subread aligner kan bruges til at sammenligne gDNA-seq- og RNA-sew- læsninger. Subjunc aligner blev specifikt designet til registrering af exon-exon junction. For oversættelse af RNA-seq-læsninger kan Subread udføre lokale sammenligninger og Subjunc udfører globale sammenligninger.

Please cite: Yang Lian, Gordon K. Smyth and Wei Shi: The R package Rsubread is easier, faster, cheaper and better for alignment and quantification of RNA sequencing reads. (PubMed) Nucleic Acids Research 47(8):e47-e47 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sumaclust
Hurtig og præcis klyngeopsætning af genomsekvenser
Versions of package sumaclust
ReleaseVersionArchitectures
trixie1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.0.31-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.36+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Med udviklingen af den næste generation af sekventering skal effektive værktøjer håndterer millioner af sekvenser på en fornuftig tid. Sumaclust er et program udviklet af LECA. Sumaclust forsøger at klyngeopsætte sekvenser på en måde som er hurtig og præcis på samme tid. Dette værktøj er blevet udviklet som en tilpasning til den type af data som oprettes af DNA-metastregkodere, dvs. fuldt ud sekventeret, korte markører. Sumaclust klyngeopsætter via de samme klyngealgoritmer som UCLUST og CD-HIT. Denne algoritme er hovedsagelig nyttig til at registrere de »fejlramte« sekvenser opretter under amplifikation og sekvensprotokoller, afledt fra »true« sekvenser.

Registry entries: Bioconda 
sumatra
Hurtig og præcis sammenligning og sekvensklynger
Versions of package sumatra
ReleaseVersionArchitectures
bookworm1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.31-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.36+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Med udviklingen af den næste generation af sekventering skal effektive værktøjer håndterer millioner af sekvenser på en fornuftig tid. Sumatra er et program udviklet af LECA. Sumatra forsøger at sammenligne sekvenser på en måde som er hurtig og præcis på samme tid. Dette værktøj er blevet udviklet som en tilpasning til den type af data som oprettes af DNA-metastregkodere, dvs. fuldt ud sekventeret, korte markører. Sumatra beregner de parvis sammenligningsbedømmelser fra et datasæt eller mellem to datasæt, med mulighed for at angive en lighedstærskel hvorefter sekvenspar som har en lavere lighed ikke rapporteres. Uddata kan gå igennem en klassifikationsproces med programmer såsom MCL eller MOTHUR.

Registry entries: SciCrunch 
tabix
Generisk indeksprogram for TAB-afgrænsede arvemassepositionsfiler
Versions of package tabix
ReleaseVersionArchitectures
bullseye1.11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bookworm1.16+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.19+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.19+ds-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.1-1amd64,armel,i386
jessie0.2.6-2armhf
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
buster1.9-12~deb10u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.19.1
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 33 users (27 upd.)*
Newer upstream!
License: DFSG free
Git

Tabix indekserer filer hvor nogle kolonner indikerer sekvenskoordinater: navn (normalt et kromosom), start og stop. Inddatafilen skal være positionssorteret og komprimeret af bgzip (tilbudt i denne pakke), som har en grænseflade der ligner gzip. Efter indeksering er tabix i stand til hurtigt at hente datalinjer efter kromosomkoordinater. Hurtig dataindhentelse fungerer også over netværk hvis en URI angives som et filnavn.

Denne pakke er bygget fra HTSlib-kilden, og tilbyder værktøjerne for bgzip, htsfile og tabix.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: Bio.tools  Bioconda 
Screenshots of package tabix
transrate-tools
Hjælpeprogram til transrate
Versions of package transrate-tools
ReleaseVersionArchitectures
bookworm1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Transrate er et bibliotek og værktøj for kommandolinjen til kvalitetsvurdering af de-novo transkriptomforsamlinger.

Denne pakke tilbyder værktøjer for kommandolinjen brugt af transrate til at behandle BAM-filer.

Please cite: Richard Smith-Unna, Chris Boursnell, Rob Patro, Julian M. Hibberd and Steven Kelly: TransRate: reference-free quality assessment of de novo transcriptome assemblies.. (PubMed,eprint) Genome Research 26(8):1134-1144 (2016)
Registry entries: Bioconda 
trimmomatic
Fleksibelt værktøj til læsetrimning af Illumina NGS-data
Versions of package trimmomatic
ReleaseVersionArchitectures
stretch0.36+dfsg-1all
sid0.39+dfsg-2all
buster0.38+dfsg-1all
bullseye0.39+dfsg-2all
bookworm0.39+dfsg-2all
trixie0.39+dfsg-2all
jessie0.32+dfsg-4all
Popcon: 9 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Trimmomatic udfører en række nyttige trimningsopgaver for illumina-parret-end og enkelt sluttede data. Udvalget af trimningstrin og deres associerede parametre angives på kommandolinjen.

De nuværende trimningstrin er:

  • ILLUMINACLIP: Klip adapter og andre illumina-specifikke sekvenser fra læsningen.
  • SLIDINGWINDOW: Udfør en glidende vinduestrimning, der klipper når først gennemsnitskvaliteten i vinduet går under en tærskel.
  • LEADING: Klip baser væk fra begyndelsen af en læsning, hvis under en tærskelkvalitet
  • TRAILING: Klip baser væk i slutningen af læsningen, hvis under en tærskelkvalitet
  • CROP: Klip læsningen til en specificeret længde
  • HEADCROP: Klip det angivne antal baser fra begyndelsen af læsningen
  • MINLENGTH: Drop læsningen hvis den er under en angivet længde
  • TOPHRED33: Konverter kvalitetsbedømmelser til Phred-33
  • TOPHRED64: Konverter kvalitetsbedømmelser til Phred-64 Programmet fungerer med FASTQ (bruger phred + 33 eller phred + 64 kvalitetsbedømmelser afhængig af den anvendte Illuminadatakanal), enten uden komprimering eller gzipp'et FASTQ. Brug af gzip-formatet bestemmes baseret på .gz-udvidelsen.
The package is enhanced by the following packages: multiqc
Please cite: A.M. Bolger, M. Lohse and B. Usadel: Trimmomatic: a flexible trimmer for Illumina sequence data. (PubMed,eprint) Bioinformatics 30(15):2114-2120 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
Screenshots of package trimmomatic
trinityrnaseq
RNA-Seq De novo Assembly
Versions of package trinityrnaseq
ReleaseVersionArchitectures
buster2.6.6+dfsg-6amd64
bullseye2.11.0+dfsg-6amd64,arm64
trixie2.15.1+dfsg-5amd64,arm64,ppc64el
sid2.15.1+dfsg-5amd64,arm64,ppc64el,riscv64
stretch2.2.0+dfsg-2amd64
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Trinity repræsenterer en hidtil ukendt fremgangsmåde til effektiv og robust de novo-rekonstruktion af transkriptomer fra RNA-seq-data. Trinity kombinerer tre uafhængige programmoduler: Inchworm, Chrysalis, og Butterfly, anvendt sekventielt til at behandle store mængder af RNA-seq-læsninger. Trinity partitionerer sekvensdata i mange individuelle de Bruijn-grafer, der hver repræsenterer transkriptionel kompleksitet ved et givet gen eller locus, og derefter behandler hver graf uafhængigt for at udvinde fuld længde-isoformer ved splejsning og drille aparte transkripter afledt af paraloge gener.

Please cite: Manfred G Grabherr, Brian J Haas, Moran Yassour, Joshua Z Levin, Dawn A Thompson, Ido Amit, Xian Adiconis, Lin Fan, Raktima Raychowdhury, Qiandong Zeng, Zehua Chen, Evan Mauceli, Nir Hacohen, Andreas Gnirke, Nicholas Rhind, Federica di Palma, Bruce W Birren, Chad Nusbaum, Kerstin Lindblad-Toh, Nir Friedman and Aviv Regev: Full-length transcriptome assembly from RNA-Seq data without a reference genome.. (PubMed) Nature Biotechnology 29(7):644-652 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
uc-echo
Fejlkorrektionsalgoritme designet for kort-læsninger fra NGS
Versions of package uc-echo
ReleaseVersionArchitectures
buster1.12-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.12-18amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.12-18amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.12-18amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.12-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.12-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.12-7amd64,armel,armhf,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ECHO er en algoritme til fejlkorrektioner designet for kort-læsninger fra næstegenerations sekvensplatforme såsom Illuninas Genome Analyzer II. Algoritmen bruger en bayesiansk ramme til at forbedre kvaliteten af læsningerne i et givent datasæt ved at anvende maksimal a posteriori-estimering.

Please cite: W.-C. Kao, A.H. Chan and Y.S. Song: ECHO: A reference-free short-read error correction algorithm. (PubMed,eprint) Genome Research 21:1181-1192 (2011)
Registry entries: Bio.tools  SciCrunch 
Topics: Data management; Sequencing
vcftools
Samling af værktøjer til arbejdet med VCF-filer
Versions of package vcftools
ReleaseVersionArchitectures
sid0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.1.14+dfsg-4+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.1.16-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.1.12+dfsg-1amd64,armel,armhf,i386
bullseye0.1.16-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie-security0.1.12+dfsg-1+deb8u1amd64,armel,armhf,i386
trixie0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package vcftools:
roleprogram
Popcon: 17 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools er en programpakke designet for arbejde med VCF-filer, såsom dem oprettet af 1000 Genomes Project. Formålet med VCFtools er at tilbyde metoder for arbejde med VCF-filer: validering, sammenføjning, sammenligning og beregning af noget grundlæggende statistik om befolkningsgenetik.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet
Sekvens-assembler for nukleinsyre til meget korte læsninger
Versions of package velvet
ReleaseVersionArchitectures
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 7 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet er en »de novo«-genomisk assembler som er specielt designet for teknologier til kort læsning, såsom Solexa eller 454, udviklet af Daniel Zerbino og Ewan Birney ved European Bioinformatics Institue (EMBL-EBI), nær Cambridge, i Storbritannien.

Velvet kan i øjeblikket tage korte læsesekvenser, fjerner fejl og fremstiller dernæst unikke »contig'er« i høj kvalitet. Det anvender derefter parvis læseinformation, hvis tilgængelig, til at indhente de gentagne områder mellem contig'erne.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet-long
Sekvens-assembler for nukleinsyre til meget korte læsninger - lang version
Versions of package velvet-long
ReleaseVersionArchitectures
sid1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet er en »de novo«-genomisk assembler som er specielt designet for teknologier til kort læsning, såsom Solexa eller 454, udviklet af Daniel Zerbino og Ewan Birney ved European Bioinformatics Institue (EMBL-EBI), nær Cambridge, i Storbritannien.

Velvet kan i øjeblikket tage korte læsesekvenser, fjerner fejl og fremstiller dernæst unikke »contig'er« i høj kvalitet. Det anvender derefter parvis læseinformation, hvis tilgængelig, til at indhente de gentagne områder mellem contig'erne.

Denne pakke installerer specielle long-mode-versioner af Velvet, som anbefalet i Velvetøvelserne.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvetoptimiser
Optimer automatisk Velvet do novo-samlingsparametre
Versions of package velvetoptimiser
ReleaseVersionArchitectures
bullseye2.2.6-3all
jessie2.2.5-2all
stretch2.2.5-5all
buster2.2.6-2all
bookworm2.2.6-5all
trixie2.2.6-5all
sid2.2.6-5all
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

VelvetOptimiser er et flertrådet Perlskript for automatisk optimering af de tre primære parameterindstillinger (K, -exp_cov, -cov_cutoff) for Velvet de novo-sekvensassembler.

Registry entries: Bio.tools  Bioconda 
vsearch
Værktøj til behandling af metagenomiske sekvenser
Versions of package vsearch
ReleaseVersionArchitectures
trixie2.27.0-1amd64,arm64,ppc64el
stretch2.3.4-1amd64
buster2.10.4-1amd64
bullseye2.15.2-3amd64,arm64,ppc64el
bookworm2.22.1-1amd64,arm64,ppc64el
sid2.27.0-1amd64,arm64,ppc64el
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Alsidigt 64-bit flertrådet værktøj for behandling af metagenomiske sekvenser, inklusive søgning, klyngeopbygning, chimera-detektion, dereplikation, sortering, maskering og blanding.

Formålet med projektet er at oprette et alternativ til USEARCH-værktøjet udviklet af Robert C. Edgar (2010). Det nye værktøj bør:

  • have et 64-bit design som håndterer meget store databaser og meget mere end 4 gb hukommelse
  • være så præcis som eller mere præcis end usearch
  • være så hurtige som eller hurtigere end usearch
The package is enhanced by the following packages: vsearch-examples
Please cite: Torbjørn Rognes, Tomáš Flouri, Ben Nichols, Christopher Quince and Frédéric Mahé: VSEARCH: a versatile open source tool for metagenomics. (eprint) PeerJ 4:e2584
Registry entries: Bio.tools  Bioconda 
wham-align
Wisconsin's High-Throughput Alignment Method
Versions of package wham-align
ReleaseVersionArchitectures
bullseye0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Denne pakke tilbyder funktionalitet analog til BWA eller bowtie i sammenlignede læsninger fra næste-generations DNA-sekvensmaskiner mod et referencegenom.

Please cite: Yinan Li, Allie Terrell and Jignesh M. Patel: WHAM: A High-throughput Sequence Alignment Method (eprint) Proceedings of the ACM SIGMOD International Conference on Management of Data, SIGMOD 2011, Athens, Greece (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
wigeon
Ny implementering af Pintail 16S-detektionsredskabet for DNA-anamolier
Versions of package wigeon
ReleaseVersionArchitectures
trixie20101212+dfsg1-5all
jessie20101212+dfsg-1all
buster20101212+dfsg1-2all
bullseye20101212+dfsg1-4all
bookworm20101212+dfsg1-5all
stretch20101212+dfsg1-1all
sid20101212+dfsg1-5all
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

WigeoN undersøger sekvensbevarelse mellem en forespørgsel og en troværdig referencesekvens, begge i NAST-sammenligningsformat. Baseret på sekvensidentiteten mellem forespørgslen og referencesekvensen, er der en forventet mængde af variation blandt sammenligningen. Hvis den observerede variation er større end 95 %-kvartilen for distributionen af variation observeret mellem sekvenser der ikke er unormale, så registreres det som en anomali.

WigeoN er en ny implementering af den fleksible kommandolinjebaserede Pintail-algoritme Appl Environ. Microbiol. 2005 Dec;7112:7724-36.

WigeoN er kun nyttig til registrering af kimærer og anomalier i næsten fuldlængde 16S rRNA-sekvenser. WigeoN mangler sensitivitet med sekvenser mindre end 1.000 bp.

For at afvikle WigeoN skal du bruge NAST-formaterede sekvenser oprettet af redskabet nast-ier.

WigeoN er en del af programpakken microbiomeutil.

The package is enhanced by the following packages: microbiomeutil-data
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 

Official Debian packages with lower relevance

nanolyse
remove lambda phage reads from a fastq file
Versions of package nanolyse
ReleaseVersionArchitectures
sid1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

NanoLyse is a tool for rapid removal of contaminant DNA, using the Minimap2 aligner through the mappy Python binding. A typical application would be the removal of the lambda phage control DNA fragment supplied by ONT, for which the reference sequence is included in the package. However, this approach may lead to unwanted loss of reads from regions highly homologous to the lambda phage genome.

Please cite: Wouter De Coster, Svenn D’Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666-2669 (2018)
Registry entries: Bioconda 
python3-anndata
Kommenteret gen efter numpy-matrix
Versions of package python3-anndata
ReleaseVersionArchitectures
bookworm0.8.0-4all
bullseye0.7.5+ds-3all
sid0.8.0-4all
upstream0.10.6
Popcon: 2 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

AnnData tilbyder en skalerbar måde at holde styr på data sammen med lærte kommentarer. Det bruges i Scanpy, som det oprindelig blev udviklet for. Begge pakker er blevet introduceret i Gnome Biology (2018).

Please cite: F. Alexander Wolf, Philipp Angerer and Fabian J. Theis: SCANPY: large-scale single-cell gene expression data analysis.. (PubMed) Genome Biol. 19:15 (2018)
Registry entries: Bioconda 
r-bioc-isoformswitchanalyzer
Identify, Annotate and Visualize Alternative Splicing and
Versions of package r-bioc-isoformswitchanalyzer
ReleaseVersionArchitectures
trixie2.2.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.20.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Isoform Switches with Functional Consequences from both short- and long-read RNA-seq data. Analysis of alternative splicing and isoform switches with predicted functional consequences (e.g. gain/loss of protein domains etc.) from quantification of all types of RNASeq by tools such as Kallisto, Salmon, StringTie, Cufflinks/Cuffdiff etc.

Registry entries: Bio.tools  Bioconda 

Debian packages in contrib or non-free

bcbio
toolkit for analysing high-throughput sequencing data
Versions of package bcbio
ReleaseVersionArchitectures
buster1.1.2-3all
sid1.2.9-2 (contrib)all
bullseye1.2.5-1 (contrib)all
bookworm1.2.9-2 (contrib)all
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free, but needs non-free components
Git

This package installs the command line tools of the bcbio-nextgen toolkit implementing best-practice pipelines for fully automated high throughput sequencing analysis.

A high-level configuration file specifies inputs and analysis parameters to drive a parallel pipeline that handles distributed execution, idempotent processing restarts and safe transactional steps. The project contributes a shared community resource that handles the data processing component of sequencing analysis, providing researchers with more time to focus on the downstream biology.

This package builds and having it in Debian unstable helps the Debian developers to synchronize their efforts. But unless a series of external dependencies are not installed manually, the functionality of bcbio in Debian is only a shadow of itself. Please use the official distribution of bcbio for the time being, which means "use conda". The TODO file in the Debian directory should give an overview on progress for Debian packaging.

Registry entries: Bio.tools  Bioconda 
cufflinks
Transcript assembly, differential expression and regulation for RNA-Seq
Versions of package cufflinks
ReleaseVersionArchitectures
buster2.2.1+dfsg.1-3 (non-free)amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.2.1-3 (non-free)amd64
sid2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2.1+dfsg.1-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.2.1-1 (non-free)amd64
Popcon: 2 users (0 upd.)*
Versions and Archs
License: non-free
Git

Cufflinks assembles transcripts, estimates their abundances, and tests for differential expression and regulation in RNA-Seq samples. It accepts aligned RNA-Seq reads and assembles the alignments into a parsimonious set of transcripts. Cufflinks then estimates the relative abundances of these transcripts based on how many reads support each one.

This package provides the binary of cufflinks and associated tools, i.e. compress_gtf, cuffcompare, cuffdiff, cuffmerge, cuffnorm, cuffquant and gtf_to_sam.

Please cite: Cole Trapnell, Brian A Williams, Geo Pertea, Ali Mortazavi, Gordon Kwan, Marijke J van Baren, Steven L Salzberg, Barbara J Wold and Lior Pachter: Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. (PubMed) Nature Biotechnology 28(5):511-515 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
vdjtools
framework for post-analysis of B/T cell repertoires
Versions of package vdjtools
ReleaseVersionArchitectures
bullseye1.2.1+git20190311-5 (non-free)all
trixie1.2.1+git20190311+repack-2 (non-free)all
sid1.2.1+git20190311+repack-2 (non-free)all
bookworm1.2.1+git20190311+repack-1 (non-free)all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: non-free
Git

VDJtools is an open-source Java/Groovy-based framework designed to facilitate analysis of immune repertoire sequencing (RepSeq) data. VDJtools computes a wide set of statistics and is able to perform various forms of cross-sample analysis. Both comprehensive tabular output and publication-ready plots are provided.

The main aims of the VDJtools Project are:

  • To ensure consistency between post-analysis methods and results
  • To save the time of bioinformaticians analyzing RepSeq data
  • To create an API framework facilitating development of new RepSeq analysis applications
  • To provide a simple enough command line tool so it could be used by immunologists and biologists with little computational background
Please cite: M Shugay, D.V. Bagaev, M.A. Turchaninova, D.A. Bolotin, O.V. Britanova, E.V. Putintseva, M.V. Pogorelyy, V.I. Nazarov VI, I.V. Zvyagin, V.I. Kirgizova, K.I. Kirgizov, E.V. Skorobogatova and D.M. Chudakov: VDJtools: Unifying Post-analysis of T Cell Receptor Repertoires. (PubMed,eprint) PLoS Comput Biol. 11(11):e1004503 (2015)

Packaging has started and developers might try the packaging code in VCS

graphmap2
highly sensitive and accurate mapper for long, error-prone reads
Versions of package graphmap2
ReleaseVersionArchitectures
VCS0.6.4-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.6.4-1

GraphMap2 is a highly sensitive and accurate mapper for long, error- prone reads. The mapping algorithm is designed to analyse nanopore sequencing reads, which progressively refines candidate alignments to robustly handle potentially high-error rates and a fast graph traversal to align long reads with speed and high precision (>95%). Evaluation on MinION sequencing data sets against short- and long-read mappers indicates that GraphMap increases mapping sensitivity by 10–80% and maps

95% of bases. GraphMap alignments enabled single-nucleotide variant calling on the human genome with increased sensitivity (15%) over the next best mapper, precise detection of structural variants from length 100 bp to 4 kbp, and species and strain-specific identification of pathogens using MinION reads.

Please cite: Ivan Sović, Mile Šikić, Andreas Wilm, Shannon Nicole Fenlon, Swaine Chen and Niranjan Nagarajan: Fast and sensitive mapping of nanopore sequencing reads with GraphMap. (PubMed,eprint) Nature Communications 7(11307) (2016)
Registry entries: Bioconda 
mosaik-aligner
reference-guided aligner for next-generation sequencing
Versions of package mosaik-aligner
ReleaseVersionArchitectures
VCS2.2.30+20140627-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 2.2.30+20140627-1

MosaikBuild converts various sequence formats into Mosaik’s native read format. MosaikAligner pairwise aligns each read to a specified series of reference sequences. MosaikSort resolves paired-end reads and sorts the alignments by the reference sequence coordinates. Finally, MosaikText converts alignments to different text-based formats.

At this time, the workflow consists of supplying sequences in FASTA, FASTQ, Illumina Bustard & Gerald, or SRF file formats and producing results in the BLAT axt, the BAM/SAM, the UCSC Genome Browser bed, or the Illumina ELAND formats.

nanoplot
plotting scripts for long read sequencing data
Versions of package nanoplot
ReleaseVersionArchitectures
VCS1.36.2-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 1.36.2-1

NanoPlot provides plotting scripts for long read sequencing data.

These scripts perform data extraction from Oxford Nanopore sequencing data in the following formats:

  • fastq files (optionally compressed)
  • fastq files generated by albacore, guppy or MinKNOW containing additional information (optionally compressed)
  • sorted bam files
  • sequencing_summary.txt output table generated by albacore, guppy or MinKnow basecalling (optionally compressed)
  • fasta files (optionally compressed)
  • multiple files of the same type can be offered simultaneously
Please cite: Wouter De Coster, Svenn D'Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666-2669 (2018)
Registry entries: Bioconda 
r-bioc-mofa2
Multi-Omics Factor Analysis v2
Versions of package r-bioc-mofa2
ReleaseVersionArchitectures
VCS1.2.2+ds-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.2.2+ds-1

The MOFA2 package contains a collection of tools for training and analysing multi-omic factor analysis (MOFA). MOFA is a probabilistic factor model that aims to identify principal axes of variation from data sets that can comprise multiple omic layers and/or groups of samples. Additional time or space information on the samples can be incorporated using the MEFISTO framework, which is part of MOFA2. Downstream analysis functions to inspect molecular features underlying each factor, vizualisation, imputation etc are available.

Registry entries: Bio.tools  Bioconda 
umap
quantify genome and methylome mappability
Versions of package umap
ReleaseVersionArchitectures
VCS1.0.0-1all
Versions and Archs
License: GPL-3.0
Debian package not available
Git
Version: 1.0.0-1

Umap identifies uniquely mappable regions of any genome. Its Bismap extension identifies mappability of the bisulfite converted genome (methylome).

Please cite: Mehran Karimzadeh, Carl Ernst, Anshul Kundaje and Michael M. Hoffman: Umap and Bismap: quantifying genome and methylome mappability. (PubMed,eprint) Nucleic Acids Res. 46(20):e120 (2018)
Registry entries: Bioconda 

No known packages available

annovar
annotate genetic variants detected from diverse genomes
License: Open Source for non-profit
Debian package not available

ANNOVAR is an efficient software tool to utilize update-to-date information to functionally annotate genetic variants detected from diverse genomes (including human genome hg18, hg19, as well as mouse, worm, fly, yeast and many others). Given a list of variants with chromosome, start position, end position, reference nucleotide and observed nucleotides, ANNOVAR can perform:

 1. Gene-based annotation: identify whether SNPs or CNVs cause protein coding
    changes and the amino acids that are affected. Users can flexibly use RefSeq
    genes, UCSC genes, ENSEMBL genes, GENCODE genes, or many other gene definition
    systems.
 2. Region-based annotations: identify variants in specific genomic regions,
    for example, conserved regions among 44 species, predicted transcription
    factor binding sites, segmental duplication regions, GWAS hits, database
    of genomic variants, DNAse I hypersensitivity sites, ENCODE
    H3K4Me1/H3K4Me3/H3K27Ac/CTCF sites, ChIP-Seq peaks, RNA-Seq peaks, or many
    other annotations on genomic intervals.
 3. Filter-based annotation: identify variants that are reported in dbSNP,
    or identify the subset of common SNPs (MAF>1%) in the 1000 Genome Project,
    or identify subset of non-synonymous SNPs with SIFT score>0.05, or many
    other annotations on specific mutations.
 4. Other functionalities: Retrieve the nucleotide sequence in any
    user-specific genomic positions in batch, identify a candidate gene list
    for Mendelian diseases from exome data, identify a list of SNPs from
    1000 Genomes that are in strong LD with a GWAS hit, and many other
    creative utilities.

In a modern desktop computer (3GHz Intel Xeon CPU, 8Gb memory), for 4.7 million variants, ANNOVAR requires ~4 minutes to perform gene-based functional annotation, or ~15 minutes to perform stepwise "variants reduction" procedure, making it practical to handle hundreds of human genomes in a day.

forge
genome assembler for mixed read types
License: Apache 2.0
Debian package not available

Forge Genome Assembler is a parallel, MPI based genome assembler for mixed read types.

Forge is a classic "Overlap layout consensus" genome assembler written by Darren Platt and Dirk Evers. Implemented in C++ and using the parallel MPI library, it runs on one or more machines in a network and can scale to very large numbers of reads provided there is enough collective memory on the machines used. It generates a full consensus alignment of all reads, can handle mixtures of sanger, 454 and illumina reads. There is some support for solid color space and it includes built in tools for vector trimming and contamination screening.

Forge and was originally developed at Exelixis and they have kindly agreed to place the software which underwent much subsequent development outside Exelixis, into the public domain. Forge works with most of the common MPI implementations.

Remark of Debian Med team: Competitor to MIRA2 and wgs-assembler

This package was requested by William Spooner whs@eaglegenomics.com as a competitor to MIRA2 and wgs-assembler.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 237444