Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Cloud
Debian Med - Bioinformatikanwendungen für Cloud Computing

Dieses Metapaket wird Debian-Pakete mit Bezug zu Molekularbiologie, Strukturbiologie und Bioinformatik für den Einsatz in den Biowissenschaften installieren, die nicht von grafischen Werkzeugsätzen abhängen. Dadurch können diese Pakete in Cloud-Computing-Clustern verwendet werden, auf denen der Speicherplatz limitiert sein kann.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Cloud packages

Official Debian packages with high relevance

abyss
Paralleler De-novo-Sequenzassembler für »short reads«
Versions of package abyss
ReleaseVersionArchitectures
stretch2.0.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.5-7amd64,arm64,armhf,i386
stretch-backports2.1.5-7~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.3.5+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
sid2.3.10-1amd64,arm64,mips64el,ppc64el,riscv64
trixie2.3.9-1amd64,arm64,mips64el,ppc64el,riscv64
bullseye2.2.5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.5.2-1 (non-free)amd64
Debtags of package abyss:
roleprogram
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

ABySS ist ein paralleler De-novo-Sequenzassembler, der für short reads ausgelegt ist. Er kann verwendet werden, um Genom- oder Transkriptomsequenzdaten zusammenzustellen. Die Parallelisierung erfolgt über MPI, OpenMP und pthread.

Please cite: Shaun D. Jackman, Benjamin P. Vandervalk, Hamid Mohamadi, Justin Chu, Sarah Yeo, S. Austin Hammond, Golnaz Jahesh, Hamza Khan, Lauren Coombe, Rene L. Warren and İnanç Birol: "ABySS 2.0: resource-efficient assembly of large genomes using a Bloom filter". (PubMed,eprint) Genome Research 27(5):768-777 (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
acedb-other
Abrufen von DNA- oder Proteinsequenzen
Versions of package acedb-other
ReleaseVersionArchitectures
sid4.9.39+dfsg.02-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.9.39+dfsg.01-5amd64,armel,armhf,i386
stretch4.9.39+dfsg.02-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.9.39+dfsg.02-4amd64,arm64,armhf,i386
bullseye4.9.39+dfsg.02-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.9.39+dfsg.02-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package acedb-other:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
scopeutility
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Dieses Paket vereint alle kleinen Anwendungen die acedb unter dem Ziel »other« seines Makefiles sammelt.

Efetch: vermutlich kurz für: »entry fetch« (Eintrag abrufen), sammelt Sequenzinformationen von bekannten DNA- und Proteindatenbanken.

Please cite: L. D. Stein and J. Thierry-Mieg: AceDB: a genome database management system. Computing in Science and Engineering 1(3):44-52 (1999)
Registry entries: Bio.tools 
aevol
Digitales genetisches Modell zur Durchführung von Evolutionsexperimenten in silico
Versions of package aevol
ReleaseVersionArchitectures
stretch4.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.4-1amd64,armel,armhf,i386
bookworm5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster5.0-2amd64,arm64,armhf,i386
trixie5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Aevol ist ein digitales genetisches Modell: Populationen digitaler Organismen werden einem Prozess von Selektion und Variation ausgesetzt, wodurch eine darwinsche Dynamik entsteht.

Durch Modifikation der Selektionsfaktoren (z.B. Populationsgröße, Art der Umgebung, Variation der Umwelt) oder der Variationsfaktoren (z.B. Mutationsraten, Chromosomenveränderungsraten, Arten der Veränderung, horizontale Transfers) kann experimentell der Einfluss dieser Parameter auf die Struktur der sich entwickelnden Organismen untersucht werden. Insbesondere, da Aevol ein präzises und realistisches Modell des Erbgutes (Genom) enthält, ermöglicht es die Untersuchung struktureller Variationen des Genoms (z.B. Anzahl der Gene, Syntenie, Anteil codierender Sequenzen).

Die Simulationsplattform beinhaltet eine Sammlung von Werkzeugen zur Analyse der Phylogenien und zur Erfassung unterschiedlicher Eigenschaften der Organismen und Populationen während der Evolution.

Please cite: Dusan Misevic, Antoine Frenoy, David P. Parsons and Francois Taddei: Effects of public good properties on the evolution of cooperation. (eprint) :218-225 (2012)
alien-hunter
Interpolated Variable Order Motifs zur Identifizierung horizontal erhaltener DNA
Versions of package alien-hunter
ReleaseVersionArchitectures
jessie1.7-3all
sid1.7-10all
trixie1.7-10all
bookworm1.7-10all
bullseye1.7-8all
buster1.7-7all
stretch1.7-5all
Debtags of package alien-hunter:
fieldbiology, biology:structural
roleprogram
scopeutility
useanalysing
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Die Anwendung alien_hunter sagt vermutlichen Horizontalen Gentransfer (HGT) mit der Implementierung der Interpolated Variable Order Motifs (IVOMs) voraus. Ein IVOM-Ansatz nutzt ergänzende Tendenzen mittels variablen Anordnungen von Sequenzmotiv-Verteilungen und entdeckt verlässlicher die lokale Zusammenstellung einer Sequenz verglichen mit Methoden mit fester Anordnung. Optional können Voraussagen überführt werden in ein Hidden Markov Model (HMM) zweiter Ordnung mit zwei Zuständen, um die Lokalisierung der Grenzen der vorausgesagten Regionen zu optimieren. Die Voraussagen (embl-Format) können automatisch in den Genombetrachter Artemis geladen werden. Er ist frei unter http://www.sanger.ac.uk/Software/Artemis/ verfügbar.

Please cite: Georgios S. Vernikos and Julian Parkhill: Interpolated variable order motifs for identification of horizontally acquired DNA: revisiting the Salmonella pathogenicity islands. (PubMed,eprint) Bioinformatics 22(18):2196-2203 (2006)
Registry entries: SciCrunch 
altree
Programm zur Phylogenie-basierten Assoziations- und Lokalisierungsanalyse
Versions of package altree
ReleaseVersionArchitectures
sid1.3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.3.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3.1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.3.1-2amd64,armel,armhf,i386
buster1.3.1-7amd64,arm64,armhf,i386
stretch1.3.1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package altree:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram, shared-lib
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

ALTree wurde für entworfen, um Assoziationen zu entdecken und Suszeptibilitäts-Lokuse (susceptibility loci) mittels phylogenetischen Bäumen aus Haplotypen zu lokalisieren. Zum Einen ermöglicht sie die Entdeckung einer Assoziation zwischen einem untersuchten Gen und einer Krankheit, zum Anderen wird eine Hypothese über Suszeptibilitäts-Lokuse möglich.

Please cite: Claire Bardel, Vincent Danjean and Emmanuelle Genin: ALTree: association detection and localization of susceptibility sites using haplotype phylogenetic trees. (PubMed,eprint) Bioinformatics 22(11):1402-1403 (2006)
Registry entries: SciCrunch 
amap-align
Protein multiple alignment by sequence annealing
Versions of package amap-align
ReleaseVersionArchitectures
stretch2.2-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.2+git20080214.600fc29+dfsg-1amd64,arm64,armhf,i386
bullseye2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.2-4amd64,armel,armhf,i386
Debtags of package amap-align:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 14 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

AMAP is a command line tool to perform multiple alignment of peptidic sequences. It utilizes posterior decoding, and a sequence-annealing alignment, instead of the traditional progressive alignment method. It is the only alignment program that allows one to control the sensitivity / specificity tradeoff. It is based on the ProbCons source code, but uses alignment metric accuracy and eliminates the consistency transformation.

The Java visualisation tool of AMAP 2.2 is not yet packaged in Debian.

Please cite: Ariel S. Schwartz and Lior Pachter: Multiple alignment by sequence annealing. (eprint) Bioinformatics 23(2):e24-e29 (2007)
Registry entries: SciCrunch  Bioconda 
ampliconnoise
removal of noise from 454 sequenced PCR amplicons
Versions of package ampliconnoise
ReleaseVersionArchitectures
sid1.29-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.29-2amd64,armel,armhf,i386
stretch1.29-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.29-8amd64,arm64,armhf,i386
bullseye1.29-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.29-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package ampliconnoise:
roleprogram
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

AmpliconNoise is a package of applications to clean up high-throughput sequence data. It consists of three main parts:

Pyronoise - does flowgram-based clustering to spot misreads SeqNoise - removes PCR point mutations Perseus - removes PCR chimeras without the need for a set of reference sequences

Previously there was a standalone "Pyronoise" by the same authors and this package includes an updated version. There is also a "Denoiser" in Qiime which is related but distinct.

Please cite: Christopher Quince, Anders Lanzen, Russell J Davenport and Peter J Turnbaugh: Removing Noise From Pyrosequenced Amplicons. (PubMed,eprint) BMC Bioinformatics 12:38 (2011)
Registry entries: Bio.tools  SciCrunch 
Topics: Sequencing
anfo
Alignments/Abbildungen kurzer DNA-Sequenzen, von MPG
Versions of package anfo
ReleaseVersionArchitectures
sid0.98-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.98-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.98-7amd64,arm64,armhf,i386
stretch0.98-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.98-4amd64,armel,armhf,i386
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Anfo ist ein Mapper in der Art von Soap/Maq/Bowtie, aber die Implementierung ähnelt eher BLAST/BLAT. Anful ist für Alignments sequenzierter Reads (kurze DNA-Sequenzen) am nützlichsten, wenn die DNA-Sequenz irgendwie verändert wurde (etwa sehr alte DNA oder Bisulfit-Behandlung) und/oder wenn es zwischen Probe und Referenz mehr Abweichungen gibt, als schnelle Mapper problemlos vertragen (etwa wenn das Referenzgenom fehlt und stattdessen eine verwandte Spezies benutzt wird).

Registry entries: SciCrunch 
Topics: Sequencing
aragorn
tRNA- und tmRNA-Nachweis in Nukleotidsequenzen
Versions of package aragorn
ReleaseVersionArchitectures
buster1.2.38-2amd64,arm64,armhf,i386
bookworm1.2.38-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.41-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.2.41-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.36-4amd64,armel,armhf,i386
stretch1.2.38-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.2.38-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Das Programm verwendet heuristische Algorithmen zur Vorhersage von tRNA-Sekundärstruktur, basierend auf der Homologie mit erkannten tRNA-Konsensus-Sequenzen und der Fähigkeit zur Bildung einer basengepaarten Kleeblattstruktur. tmRNA-Gene werden mittels einer modifizierten Version des BRUCE-Programms identifiziert.

Please cite: Dean Laslett and Bjorn Canback: ARAGORN, a program to detect tRNA genes and tmRNA genes in nucleotide sequences. (PubMed,eprint) Nucleic Acids Research 32(1):11-16 (2004)
Registry entries: SciCrunch  Bioconda 
Topics: Functional, regulatory and non-coding RNA
arden
Genaue Kontrolle für das Lesen von Alignierungen unter Verwendung einer künstlichen Intelligenz
Versions of package arden
ReleaseVersionArchitectures
jessie1.0-1amd64,armel,armhf,i386
sid1.0-6all
trixie1.0-6all
bookworm1.0-5all
bullseye1.0-5all
buster1.0-4all
stretch1.0-3all
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ARDEN (Artificial Reference Driven Estimation of false positives in NGS data) ist für DNA-Sequenzierung der nächsten Generation ein neuartiges Bewertungsprogramm zum Abschätzen von Fehlerraten basierend auf experimentell gewonnenen DNA-Fragmenten (reads) und einem zusätzlich generierten künstlichem Genom. Es ermöglicht die Berechnung von Fehlerraten von einem spezifizierten Datensatz und die Konstruktion einer ROC-Kurve. Nebenbei kann es für die Optimierung von Parametern für read mappers, zur Auswahl von read mappers für ein spezifisches Problem oder zum Filtern von Alignierungen basierend auf Qualitätsabschätzungen genutzt werden.

Please cite: Sven H. Giese, Franziska Zickmann and Bernhard Y. Renard: Specificity control for read alignments using an artificial reference genome-guided false discovery rate. (PubMed,eprint) Bioinformatics 30(1):9-16 (2013)
Registry entries: SciCrunch 
Topics: Sequencing
autodock
Analyse der Ligandenbindung von Proteinstrukturen
Versions of package autodock
ReleaseVersionArchitectures
bullseye4.2.6-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.2.6-2amd64,armel,armhf,i386
stretch4.2.6-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.2.6-6amd64,arm64,armhf,i386
Debtags of package autodock:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeutility
useanalysing
works-with3dmodel
Popcon: 9 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

AutoDock ist ein erstklassiger Vertreter von Programmen zur Simulation einer Bindung relativ kleiner Liganden an verhältnismäßig große Rezeptor-Proteine. In vorhergehenden Versionen waren die Liganden sehr flexibel, während das Protein dagegen sehr starr behandelt wurde. Die aktuelle Version 4 erweitert die Flexibilität auf ausgewählte Seitenketten an der Oberfläche des Proteins, berücksichtigt also auch Rotamere.

AutoDock vollzieht die Bindung des Liganden an einer Auswahl von Gittern, die das Zielprotein beschreiben. AutoGrid berechnet diese Gitter vorab.

The package is enhanced by the following packages: autogrid
Screenshots of package autodock
autodock-vina
Docking kleiner Moleküle an Proteine
Versions of package autodock-vina
ReleaseVersionArchitectures
bookworm1.2.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.1.2-3amd64,armel,armhf,i386
stretch1.1.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.2-5amd64,arm64,armhf,i386
bullseye1.1.2-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 14 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Das Programm AutoDock Vina unterstützt die Pharmaforschung, molekulares Docking und virtuelles Screening von Molekülbibliotheken. Es bietet Mehrkernunterstützung, hohe Leistung, verbesserte Genauigkeit und einfache Benutzung.

Dasselbe Institut hat das weitverbreitete autodock entwickelt.

O. Trott, A. J. Olson, AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization and multithreading, Journal of Computational Chemistry 31 (2010) 455-461

Please cite: Oleg Trott and Arthur J. Olson: AutoDock Vina: Improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. (eprint) Journal of Computational Chemistry 31(2):455-461 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
autogrid
Vorberechnung der Bindung von Liganden an ihren Rezeptor
Versions of package autogrid
ReleaseVersionArchitectures
buster4.2.6-6amd64,arm64,armhf,i386
bullseye4.2.6-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie4.2.6-2amd64,armel,armhf,i386
stretch4.2.6-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package autogrid:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeutility
useanalysing
works-with3dmodel
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Die AutoDockSuite dient der molekularen Analyse der Anheftung von kleinen, chemischen Komponenten an ihre Rezeptoren mit bekannter, dreidimensionaler Struktur.

Das AutoGrid-Programm führt Vorberechnungen zur Anheftung eines Liganden an einen Gittersatz durch, welche den Effekt von Punktladungen an Proteinen beschreiben. Der Effekt dieser Kräfte auf den Liganden wird dann durch das AutoDock-Programm analysiert.

bamtools
toolkit for manipulating BAM (genome alignment) files
Versions of package bamtools
ReleaseVersionArchitectures
bullseye2.5.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.5.2+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.5.2+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.5.1+dfsg-3amd64,arm64,armhf,i386
stretch2.4.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.3.0+dfsg-2amd64,armel,armhf,i386
Popcon: 5 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

BamTools facilitates research analysis and data management using BAM files. It copes with the enormous amount of data produced by current sequencing technologies that is typically stored in compressed, binary formats that are not easily handled by the text-based parsers commonly used in bioinformatics research.

BamTools provides both a C++ API for BAM file support as well as a command-line toolkit.

This is the bamtools command-line toolkit.

Available bamtools commands:

 convert  Converts between BAM and a number of other formats
 count    Prints number of alignments in BAM file(s)
 coverage Prints coverage statistics from the input BAM file
 filter   Filters BAM file(s) by user-specified criteria
 header   Prints BAM header information
 index    Generates index for BAM file
 merge    Merge multiple BAM files into single file
 random   Select random alignments from existing BAM file(s), intended more
          as a testing tool.
 resolve  Resolves paired-end reads (marking the IsProperPair flag as needed)
 revert   Removes duplicate marks and restores original base qualities
 sort     Sorts the BAM file according to some criteria
 split    Splits a BAM file on user-specified property, creating a new BAM
          output file for each value found
 stats    Prints some basic statistics from input BAM file(s)
The package is enhanced by the following packages: multiqc
Please cite: Derek W. Barnett, Erik K. Garrison, Aaron R. Quinlan, Michael P. Stromberg and Gabor T. Marth: BamTools: a C++ API and toolkit for analyzing and managing BAM files. (PubMed,eprint) Bioinformatics 27(12):1691-2 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bedtools
Hilfswerkzeugsammlung zum Vergleich genomischer Merkmale
Versions of package bedtools
ReleaseVersionArchitectures
buster2.27.1+dfsg-4amd64,arm64,armhf
sid2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.30.0+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.21.0-1amd64,armhf,i386
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bullseye2.30.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 31 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Mit den Hilfswerkzeugen BEDTools können gewöhnliche genomische Aufgaben erledigt werden, etwa überlappende Merkmale und Berechnung der Abdeckung. Die Hilfswerkzeuge basieren großteils auf vier weit verbreiteten Dateiformaten: BED, GFF/GTF, VCF und SAM/BAM. Mit den BEDTools können ausgeklügelte Pipelines entwickelt werden, die komplizierte Forschungsfragen beantworten, indem verschiedene BEDTools zusammenarbeiten.

Das Dienstprogramm groupBy wird im Paket filo verteilt.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bioperl
Perl-Werkzeuge für bioinformatische Anwendungen
Versions of package bioperl
ReleaseVersionArchitectures
trixie1.7.8-1all
bullseye1.7.7-2all
jessie1.6.924-1all
stretch1.7.1-2all
buster1.7.2-3all
sid1.7.8-1all
bookworm1.7.8-1all
Debtags of package bioperl:
devellang:perl, library
fieldbiology, biology:bioinformatics
roledevel-lib, shared-lib
Popcon: 48 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Das Bioperl-Projekt ist eine Gemeinschaftsarbeit von Bioinformatikern aus vielen Ländern, um etablierte bioinformatische Verfahren als standardisierte, an CPAN angepasste, gut dokumentierte und frei verfügbare Perl-Module zusammenzutragen. Bioperl hat eine sehr hohe Akzeptanz in der wissenschaftlichen Gemeinschaft und wird in vielen sehr bekannten Projekten genutzt, etwa bei Ensembl.

Die empfohlenen Pakete werden benötigt, um einige der enthaltenen Binärprogramme auszuführen. Eine ausführliche Erklärung einschließlich der spezifischen Perl-Module finden Sie in README.Debian.

Die vorgeschlagene Paket erweitert die Handbuchseiten.

Please cite: Jason E Stajich, David Block, Kris Boulez, Steven E Brenner, Stephen A Chervitz, Chris Dagdigian, Georg Fuellen, James G R Gilbert, Ian Korf, Hilmar Lapp, Heikki Lehvaslaiho, Chad Matsalla, Chris J Mungall, Brian I Osborne, Matthew R Pocock, Peter Schattner, Martin Senger, Lincoln D Stein, Elia Stupka, Mark D Wilkinson and Ewan Birney: The Bioperl toolkit: Perl modules for the life sciences. (PubMed,eprint) Genome Res. 12(10):1611-1618 (2002)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bioperl-run
BioPerl-Hüllen: Skripte
Versions of package bioperl-run
ReleaseVersionArchitectures
buster1.7.2-4all
bookworm1.7.3-9all
sid1.7.3-12all
jessie1.6.9-2all
stretch1.7.1-3all
bullseye1.7.3-6all
Debtags of package bioperl-run:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
Popcon: 8 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Enthält Skripte aus dem Paket BioPerl-Run. Dieses Paket installiert auch alle einhüllbaren Anwendungen, für die es Debian-Pakete gibt. Die nicht-freien Pakete werden von diesem Paket vorgeschlagen.

The package is enhanced by the following packages: clustalw exonerate kalign mcl
biosquid
Hilfsprogramme für die biologische Sequenzanalyse
Versions of package biosquid
ReleaseVersionArchitectures
bullseye1.9g+cvs20050121-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.9g+cvs20050121-11amd64,arm64,armhf,i386
stretch-backports1.9g+cvs20050121-11~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.9g+cvs20050121-4amd64,armel,armhf,i386
stretch1.9g+cvs20050121-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.9g+cvs20050121-15.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.9g+cvs20050121-15.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.9g+cvs20050121-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package biosquid:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, converting, editing
Popcon: 5 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

SQUID ist eine Bibliothek von C-Code-Funktionen für die Sequenzanalyse. Sie enthält auch eine Reihe von kleinen Hilfswerkzeugen, um Sequenzdateien zu konvertieren, Statistiken anzuzeigen, diese zu manipulieren und andere Funktionen auf sie anzuwenden.

Ursprünglich war der Paketname »squid«, da jedoch bereits ein Paket namens »squid« im Archiv vorhanden war (ein Proxy-Cache), wurde es auf »biosquid« umbenannt.

Dieses Paket enthält einige Werkzeuge, welche die Möglichkeiten der Bibliothek demonstrieren.

blast2
transitional dummy package to ncbi-blast+-legacy
Versions of package blast2
ReleaseVersionArchitectures
jessie2.2.26.20120620-8amd64,armel,armhf,i386
buster2.8.1-1+deb10u1all
stretch2.6.0-1all
Debtags of package blast2:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
usesearching
works-withbiological-sequence
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This is a transitional dummy package for ncbi-blast+-legacy. It can safely be removed.

The package is enhanced by the following packages: mcl
Registry entries: Bio.tools  SciCrunch  Bioconda 
bowtie
Ultraschnelles und speichersparendes Alignmentprogramm für kurze DNA-Sequenzen
Versions of package bowtie
ReleaseVersionArchitectures
buster1.2.2+dfsg-4amd64,arm64
bullseye1.3.0+dfsg1-1amd64,arm64,mips64el,ppc64el,s390x
trixie1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
bookworm1.3.1-1amd64,arm64,mips64el,ppc64el,s390x
jessie1.1.1-2amd64
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 22 users (14 upd.)*
Versions and Archs
License: DFSG free
Git

Dieses Paket beschäftigt sich mit dem Problem die Resultate der neuesten (2010) DNA-Sequenziertechniken zu interpretieren. Diese Techniken ergeben ziemlich kurze Sequenzen, die nicht direkt interpretiert werden können. Es ist die Aufgabe für Werkzeuge wie Bowtie den chromosomalen Ort (Locus) der kurzen DNA-Sequenzen festzustellen.

Bowtie führt Alignments kurzer DNA-Sequenzen (Reads) mit dem menschlichen Genom durch, mit einer Rate von über 25 Millionen Reads (mit einer Länge von 35 Basenpaaren) pro Stunde. Bowtie indiziert das Genom mit einer Burrows-Wheeler-Transformation, um den Speicherverbrauch gering zu halten; normalerweise etwa 2,2 GB für das menschliche Genom (2,9 GB für »paired- end«).

The package is enhanced by the following packages: bowtie-examples multiqc
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
bowtie2
Ultraschnelles und speichersparendes Alignmentprogramm für kurze DNA-Sequenzen
Versions of package bowtie2
ReleaseVersionArchitectures
buster2.3.4.3-1amd64
sid2.5.4-1amd64,arm64,mips64el,ppc64el,riscv64
trixie2.5.4-1amd64,arm64,mips64el,ppc64el,riscv64
bookworm2.5.0-3amd64,arm64,mips64el,ppc64el
stretch2.3.0-2amd64
bullseye2.4.2-2amd64,arm64,mips64el,ppc64el
jessie2.2.4-1amd64
Popcon: 16 users (23 upd.)*
Versions and Archs
License: DFSG free
Git

Bowtie 2 ist ein ultraschnelles und speichersparendes Werkzeug für Alignment zwischen kurzen DNA-Sequenzen (Reads) zu langen Referenzsequenzen. Es ist besonders gut beim Ausrichten von Reads von etwa 50 bis Hunderte oder Tausende Zeichen und besonders gut beim Ausrichten an relativ großen Genomen (z.B. von Säugetieren).

Bowtie 2 indiziert das Genom mit einem FM-Index, um den Speicherbedarf gering zu halten; für das menschliche Genom beträgt der Speicherbedarf etwa 3,2 GB. Bowtie 2 unterstützt Modi für Gaps sowie lokale und »Paired-End«-Alignments.

The package is enhanced by the following packages: bowtie2-examples multiqc
Please cite: Ben Langmead and Steven L Salzberg: Fast gapped-read alignment with Bowtie 2. (PubMed) Nature Methods 9:357–359 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
boxshade
Pretty-printing von multiplen Sequenzalignments
Versions of package boxshade
ReleaseVersionArchitectures
sid3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie3.3.1-8amd64,armel,armhf,i386
stretch3.3.1-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster3.3.1-12amd64,arm64,armhf,i386
bullseye3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package boxshade:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usetypesetting
works-with-formathtml, plaintext, postscript, tex
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Boxshade erstellt gut aussehende Darstellungen von Alignments von Protein- oder DNA-Sequenzen. Das Programm alignt die Sequenzen nicht selbst, sondern benötigt als Eingabe eine Datei, die automatisch von einem Programm für Multiple Alignments oder manuell mit einem Alignment-Editor erstellt wurde.

Boxshade liest Alignments in den Formaten PILEUP-MSF, CLUSTAL-ALN, MALIGNED-data und ESEE-save (bis zu 150 Sequenzen von maximal je 10000 Elementen). Verschiedene Regeln für die Schattierung und Färbung werden angeboten, um biochemische Ähnlichkeiten der Seitenketten in den Spalten zu reflektieren. Die Ausgabe erfolgt auf den Bildschirm oder in eine Datei. Angeboten werden die Formate ANSI/VT100, PS/EPS, RTF, HPGL, ReGIS, LJ250-printer, ASCII, xFIG, PICT und HTML.

Registry entries: Bio.tools  SciCrunch 
bwa
Burrows-Wheeler Aligner
Versions of package bwa
ReleaseVersionArchitectures
stretch0.7.15-2+deb9u1amd64
sid0.7.18-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.18-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.17-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.7.17-3amd64
stretch-backports0.7.17-1~bpo9+1amd64
jessie0.7.10-1amd64
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 18 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

BWA (Burrows-Wheeler Aligner) ist ein Softwarepaket für das Abbilden gering abweichender Sequenzen auf eine große Referenzsequenz, etwa das menschliche Genom. Es besteht aus drei Algorithmen: BWA-backtrack, BWA-SW und BWA-MEM. BWA-backtrack ist für Illumina-Sequenz-Reads bis zu 100 Basenpaaren (bp) geeignet, während die anderen zwei Algorithmen für längere Sequenzen zwischen 70 bp und 1 Megabasenpaaren (Mbp) geeignet sind. BWA-MEM und BWA-SW teilen ähnliche Merkmale wie Unterstützung für lange Reads und Split-Alignments. BWA-MEM ist jedoch neuer und wird für hochqualitative Anfragen empfohlen, da es schneller und genauer ist. BWA-MEM ist zudem für Illumina-Reads mit einer Länge von 70 bis 100 bp leistungsfähiger als BWA-backtrack.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
cassiopee
index and search tool in genomic sequences
Versions of package cassiopee
ReleaseVersionArchitectures
bookworm1.0.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.9-2amd64,arm64,armhf,i386
stretch1.0.5-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.0.1+dfsg-3amd64,armel,armhf,i386
trixie1.0.9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Cassiopee index and search library C implementation. It is a complete rewrite of the ruby Cassiopee gem. It scans an input genomic sequence (dna/rna/protein) and search for a subsequence with exact match or allowing substitutions (Hamming distance) and/or insertion/deletions.

This package contains the cassiopee and cassiopeeknife tools.

Registry entries: SciCrunch  Bioconda 
cd-hit
Programme zur schnellen Gruppierung von Sequenzen
Versions of package cd-hit
ReleaseVersionArchitectures
jessie4.6.1-2012-08-27-2amd64,armel,armhf,i386
stretch4.6.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.6.8-2amd64,arm64,armhf,i386
bullseye4.8.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 9 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

cd-hit enthält eine Anzahl an Programmen, um Sequenzen zu gruppieren. cd-hit gruppiert Proteine zu Clustern, die eine benutzerdefinierte Ähnlichkeitsschwelle einhalten. cd-hit-est ähnelt cd-hit, gruppiert allerdings Nukleotidsequenzen (ohne Introns). cd-hit-est2 ähnelt cd-hit-est, vergleicht jedoch zwei Nukleotid-Datensätze. Eine Anzahl an weiteren zugehörigen Programmen sind ebenfalls in diesem Paket enthalten. Weitere Informationen finden Sie im Benutzerhandbuch von cd-hit, das auch Teil dieses Pakets ist.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
cdbfasta
CDB-Werkzeuge zur Indizierung und Abfrage für multi-FASTA-Dateien
Versions of package cdbfasta
ReleaseVersionArchitectures
buster0.99-20100722-5amd64,arm64,armhf,i386
trixie1.00+git20230710.da8f5ba+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.00+git20181005.014498c+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.00+git20230710.da8f5ba+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.00+git20181005.014498c+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.99-20100722-1amd64,armel,armhf,i386
stretch0.99-20100722-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

CDB (Constant DataBase) kann zur Index-Erstellung verwendet werden, damit jede bestimmte Sequenz in großen multi-FASTA-Dateien schnell gefunden werden kann. Um Platz zu sparen, besitzt es die Option Dateneinträge zu komprimieren.

Registry entries: SciCrunch 
circos
Kurvenzeichner (Plotter) zur Datenvisualisierung
Versions of package circos
ReleaseVersionArchitectures
stretch0.69.4+dfsg-1all
jessie0.66-1all
buster0.69.6+dfsg-2all
bullseye0.69.9+dfsg-2all
bookworm0.69.9+dfsg-2all
trixie0.69.9+dfsg-2all
sid0.69.9+dfsg-2all
Debtags of package circos:
fieldbiology:bioinformatics
roleprogram
useviewing
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Circos visualisiert Daten in einem kreisförmigen Layout – ideal, um Beziehungen zwischen Objekten oder Positionen zu untersuchen und hochinformative Grafiken in Publikationsqualität zu erstellen.

Dieses Paket stellt die Plot-Engine von Circos bereit. Sie ist befehlszeilengesteuert (wie gnuplot) und vollständig skriptfähig.

Please cite: Martin I Krzywinski, Jacqueline E Schein, Inanc Birol, Joseph Connors, Randy Gascoyne, Doug Horsman, Steven J Jones and Marco A Marra: Circos: An information aesthetic for comparative genomics. (PubMed,eprint) Genome Research 19(9):1639-45 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
clearcut
extremely efficient phylogenetic tree reconstruction
Versions of package clearcut
ReleaseVersionArchitectures
bookworm1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.9-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.9-1amd64,armel,armhf,i386
buster1.0.9-3amd64,arm64,armhf,i386
stretch1.0.9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Clearcut is the reference implementation for the Relaxed Neighbor Joining (RNJ) algorithm by J. Evans, L. Sheneman, and J. Foster from the Initiative for Bioinformatics and Evolutionary Studies (IBEST) at the University of Idaho.

Please cite: Jason Evans, Luke Sheneman and James A. Foster: Relaxed Neighbor-Joining: A Fast Distance-Based Phylogenetic Tree Construction Method. (PubMed) J. Mol. Evol. 62(6):785-792 (2006)
Registry entries: SciCrunch  Bioconda 
clonalframe
inference of bacterial microevolution using multilocus sequence data
Versions of package clonalframe
ReleaseVersionArchitectures
buster1.2-9amd64,arm64,armhf,i386
bullseye1.2-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.2-3amd64,armel,armhf,i386
stretch1.2-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package clonalframe:
roleprogram
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ClonalFrame identifies the clonal relationships between the members of a sample, while also estimating the chromosomal position of homologous recombination events that have disrupted the clonal inheritance.

ClonalFrame can be applied to any kind of sequence data, from a single fragment of DNA to whole genomes. It is well suited for the analysis of MLST data, where 7 gene fragments have been sequenced, but becomes progressively more powerful as the sequenced regions increase in length and number up to whole genomes. However, it requires the sequences to be aligned. If you have genomic data that is not aligned, it is recommend to use Mauve which produces alignment of whole bacterial genomes in exactly the format required for analysis with ClonalFrame.

Please cite: Xavier Didelot and Daniel Falush: Inference of Bacterial Microevolution Using Multilocus Sequence Data. (PubMed,eprint) Genetics Advance 175:1251-1266 (2006)
Registry entries: SciCrunch 
clustalo
General-purpose multiple sequence alignment program for proteins
Versions of package clustalo
ReleaseVersionArchitectures
trixie1.2.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.1-1amd64,armel,armhf,i386
stretch1.2.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.4-2amd64,arm64,armhf,i386
bullseye1.2.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 17 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Clustal Omega is a general-purpose multiple sequence alignment (MSA) program, primarily for amino-acid sequences. It produces high quality MSAs and is capable of handling data sets of hundreds of thousands of sequences in reasonable time, using multiple processors where available.

Please cite: Fabian Sievers, Andreas Wilm, David Dineen, Toby J Gibson, Kevin Karplus, Weizhong Li, Rodrigo Lopez, Hamish McWilliam, Michael Remmert, Johannes Söding, Julie D Thompson and Desmond G Higgins: Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. (PubMed,eprint) Molecular Systems Biology 7:539 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
clustalw
Globale multiple Alignments von Nukleotid- oder Peptidsequenzen
Versions of package clustalw
ReleaseVersionArchitectures
jessie2.1+lgpl-4amd64,armel,armhf,i386
buster2.1+lgpl-6amd64,arm64,armhf,i386
stretch2.1+lgpl-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.1+lgpl-7amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid2.1+lgpl-7amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm2.1+lgpl-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.1+lgpl-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package clustalw:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 17 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Clustal W führt ein Alignment mehrerer Nukleotid- oder Aminosäurensequenzen aus. Das Programm erkennt das Format der Eingabesequenzen und ob die Sequenzen aus Nuklein- (DNA/RNA) oder Aminosäuren (Proteine) bestehen. Das Ausgabeformat kann aus verschiedenen Formaten für multiple Alignments ausgewählt werden, etwa Phylip oder FASTA. Clustal W ist allgemein anerkannt.

Die Ausgabe von Clustal W kann händisch editiert werden, jedoch wird ein Alignment-Editor wie SeaView oder Clustal X empfohlen. Bei der Erstellung eines Modells aus Ihrem Alignment, kann die Ausgabe für verbesserte Datenbanksuchen verwendet werden. Das Debian-Paket hmmer erstellt dies mittels eines Hidden-Markov-Modells (HMM).

The package is enhanced by the following packages: clustalw-mpi
Please cite: M. A. Larkin, G. Blackshields, N. P. Brown, R. Chenna, P. A. McGettigan, H. McWilliam, F. Valentin, I.M. Wallace, A. Wilm, R. Lopez, J. D. Thompson, T. J. Gibson and D. G. Higgins: Clustal W and Clustal X version 2.0. (PubMed,eprint) Bioinformatics 23(21):2947-2948 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
concavity
Vorhersage von Proteinliganden-Bindungsstellen mittels Struktur und Konservierung
Versions of package concavity
ReleaseVersionArchitectures
bookworm0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1+dfsg.1-4amd64,arm64,armhf,i386
stretch0.1+dfsg.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.1-2amd64,armel,armhf,i386
sid0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ConCavity sagt Bindungsstellen von Proteinliganden voraus, indem die evolutionäre Sequenzkonservierung und dreidimensionale Struktur verbunden werden.

ConCavity akzeptiert als Eingabe das Proteinstrukturformat PDB und optional Dateien, die die evolutionäre Sequenzkonservierung der Ketten in der Strukturdatei charakterisieren.

Die folgenden Resultatdateien werden standardmäßig erstellt:

  • Vorhersagen von Rest-Ligandenbindung für jede Kette (*.scores).
  • Vorhersagen von Rest-Ligandenbindung in einer Datei des Formats PDB (Rest-Scores sind im temorären »factor«-Feld platziert, *_residue.pdb).
  • Vorhersage von Bindungstaschen in einer Datei des Formats DX (*.dx).
  • PyMOL-Skript um die Vorhersagen zu visualisieren (*.pml).
The package is enhanced by the following packages: conservation-code
Please cite: John A. Capra, Roman A. Laskowski, Janet M. Thornton, Mona Singh and Thomas A. Funkhouser: Predicting Protein Ligand Binding Sites by Combining Evolutionary Sequence Conservation and 3D Structure. (PubMed) PLoS Computational Biology 5(12):e1000585 (2009)
Registry entries: SciCrunch 
conservation-code
Werkzeug zur Bewertung von Proteinsequenz-Konservierung
Versions of package conservation-code
ReleaseVersionArchitectures
bookworm20110309.0-8all
jessie20110309.0-3all
stretch20110309.0-5all
buster20110309.0-7all
bullseye20110309.0-8all
sid20110309.0-8all
trixie20110309.0-8all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Das Paket stellt das Werkzeug score_conservation(1) bereit, das die Konservierung bei Proteinsequenzen bewertet.

Die folgenden Bewertungsmethoden für Konservierungen sind implementiert:

  • Summe aller Paare
  • gewichtete Summe aller Paare
  • Shannon-Entropie
  • Shannon-Entropie nach Eigenschaften gruppiert (Mirny und Shakhnovich 1995, Valdar und Thornton 2001)
  • relative Entropie nach Eigenschaften gruppiert (Williamson 1995)
  • von-Neumann-Entropie (Caffrey et al 2004)
  • relative Entropie (Samudrala und Wang 2006)
  • Jensen–Shannon-Divergenz (Capra und Singh 2007)

Ebenso enthalten ist eine fensterbasierte Erweiterung, die die geschätzte Konservierung von sequenziell ähnlichen Resten in den Score für jede Spalte einarbeitet. Diese Fensterfunktion kann auf jede der genannten Bewertungsmethoden angewandt werden.

Das Programm akzeptiert Alignments in den Formaten CLUSTAL und FASTA.

Die sequenzspezifische Ausgabe kann auch als Eingabe der Konservierung für ConCavitiy verwendet werden.

Konservierung trifft beim Identifizieren von aktiven Zentren und Resten in der Nähe von gebundenen Liganden gute Voraussagen.

Please cite: John A. Capra and Mona Singh: Predicting functionally important residues from sequence conservation. (PubMed) Bioinformatics 23(15):1875-82 (2007)
datamash
statistics tool for command-line interface
Versions of package datamash
ReleaseVersionArchitectures
bullseye1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.7-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.6-2amd64,armel,armhf,i386
trixie1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.4-1amd64,arm64,armhf,i386
bookworm1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 43 users (17 upd.)*
Versions and Archs
License: DFSG free
Git

GNU Datamash is a command-line program which performs basic numeric, textual and statistical operations on input textual data files. It is designed to be portable and reliable, and aid researchers to easily automate analysis pipelines, without writing code or even short scripts.

Registry entries: SciCrunch 
dialign
Segmentbasiertes multiples Sequenzalignment
Versions of package dialign
ReleaseVersionArchitectures
jessie2.2.1-7amd64,armel,armhf,i386
sid2.2.1-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2.1-10amd64,arm64,armhf,i386
bookworm2.2.1-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2.1-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.2.1-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package dialign:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 12 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Das Kommandozeilenwerkzeug DIALIGN2 führt ein multiples Alignment von Protein- oder DNA-Sequenzen aus. Es erstellt Alignments aus gap-freien Paaren von ähnlichen Sequenzsegmenten. Dieses Bewertungsverfahren ist der grundlegende Unterschied zwischen DIALIGN und anderen globalen oder lokalen Methoden für Sequenzalignments. Beachten Sie, dass DIALIGN bei Gaps das Ergebnis nicht schlechter bewertet.

Please cite: Burkhard Morgenstern: DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment. (PubMed,eprint) Bioinformatics 15(3):211-218 (1999)
Registry entries: Bio.tools  SciCrunch  Bioconda 
dialign-tx
Segmentbasiertes multiples Sequenzalignment
Versions of package dialign-tx
ReleaseVersionArchitectures
bullseye1.0.2-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.2-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.2-7amd64,armel,armhf,i386
sid1.0.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.2-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.2-12amd64,arm64,armhf,i386
Debtags of package dialign-tx:
fieldbiology, biology:bioinformatics
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 11 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

DIALIGN-TX ist ein Kommandozeilenwerkzeug, um mehrere Protein- oder DNA-Sequenzen aneinander auszurichten (»zu alignen«). Es handelt sich um eine vollständige Reimplementation des segmentbasierten Ansatzes, einschließlich einiger neuer Verbesserungen und Heuristiken und anderer Verbesserungen, die im Vergleich mit DIALIGN 2.2 oder DIALIGN-T deutlich die Qualität der ermittelten Alignments erhöht. Für paarweise Alignments nutzt DIALIGN-TX einen Algorithmus zur Verkettung von Fragmenten, der Ketten niedrig bewerteter lokaler Alignments den isolierten höher bewerteten Fragmenten vorzieht. Für multiple Alignments nutzt DIALIGN-TX eine verbesserte, erfolgshungrige Prozedur, die nicht auf falsche lokale Sequenzähnlichkeiten hereinfällt.

The package is enhanced by the following packages: dialign-tx-data
Please cite: Amarendran R. Subramanian, Michael Kaufmann and Burkhard Morgenstern: DIALIGN-TX: greedy and progressive approaches for segment-based multiple sequence alignment. (PubMed) Algorithms for Molecular Biology 3(1):6 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
discosnp
discovering Single Nucleotide Polymorphism from raw set(s) of reads
Versions of package discosnp
ReleaseVersionArchitectures
stretch1.2.6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
trixie2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
sid2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
jessie1.2.5-1amd64,armel,armhf,i386
buster2.3.0-2amd64,arm64,i386
bullseye4.4.4-1amd64,arm64,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Software discoSnp is designed for discovering Single Nucleotide Polymorphism (SNP) from raw set(s) of reads obtained with Next Generation Sequencers (NGS).

Note that number of input read sets is not constrained, it can be one, two, or more. Note also that no other data as reference genome or annotations are needed.

The software is composed by two modules. First module, kissnp2, detects SNPs from read sets. A second module, kissreads, enhance the kissnp2 results by computing per read set and for each found SNP:

 1) its mean read coverage
 2) the (phred) quality of reads generating the polymorphism.

This program is superseded by DiscoSnp++.

Registry entries: Bio.tools  SciCrunch  Bioconda 
disulfinder
Vorhersage der Disulfidbindungen von Cysteinen und deren Verbindungsfähigkeit
Versions of package disulfinder
ReleaseVersionArchitectures
buster1.2.11-8amd64,arm64,armhf,i386
jessie1.2.11-4amd64,armel,armhf,i386
sid1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.11-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.2.11-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package disulfinder:
roleprogram
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

»disulfinder« soll die Disulfidbindungen von Cysteinen und deren Disulfid-Verbindungsfähigkeit aus der Sequenz allein voraussagen. Disulfidbrücken spielen eine große Rolle in der Stabilisierung des Faltungsprozesses von verschiedenen Proteinen. Die Voraussage von Disulfidbrücken aus der Sequenz allein ist daher für das Studium der strukturellen und funktionalen Eigenschaften von bestimmten Proteinen nützlich. Zusätzlich kann Wissen über die Disulfidbindungen von Cysteinen bei der experimentellen Strukturbestimmung helfen und in anderen genomischen Annotationsaufgaben nützlich sein.

»disulfinder« sagt Disulfidmuster in zwei Berechnungsschritten voraus: (1) die Disulfidbindungen jedes Cysteins werden von einem binären Klassifikator (BRNN-SVM) vorausgesagt; (2) Cysteine, bei denen man weiß, dass sie an der Brückenbildung teilhaben, werden von einem rekurrenten neuronalen Netz gepaart, um ein Muster der Verbindungsfähigkeit zu erhalten.

Please cite: Alessio Ceroni, Andrea Passerini, Alessandro Vullo and Paolo Frasconi: DISULFIND: a disulfide bonding state and cysteine connectivity prediction server. (PubMed) Nucleic Acids Res 34(Web Server issue):W177-181 (2006)
Registry entries: Bio.tools  SciCrunch 
dnaclust
tool for clustering millions of short DNA sequences
Versions of package dnaclust
ReleaseVersionArchitectures
bookworm3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie3-2amd64,armel,armhf,i386
bullseye3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3-6amd64,arm64,armhf,i386
stretch3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

dnaclust is a tool for clustering large number of short DNA sequences. The clusters are created in such a way that the "radius" of each clusters is no more than the specified threshold.

The input sequences to be clustered should be in Fasta format. The id of each sequence is based on the first word of the seqeunce in the Fasta format. The first word is the prefix of the header up to the first occurrence of white space characters in the header.

Please cite: Mohammadreza Ghodsi, Bo Liu and Mihai Pop: DNACLUST: accurate and efficient clustering of phylogenetic marker genes. (PubMed,eprint) BMC Bioinformatics 12:271 (2011)
Registry entries: Bio.tools  SciCrunch 
dssp
protein secondary structure assignment based on 3D structure
Versions of package dssp
ReleaseVersionArchitectures
sid4.4.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.2.1-2amd64,armel,armhf,i386
trixie4.4.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster3.0.0-3amd64,arm64,armhf,i386
bookworm4.2.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

DSSP is an application you use to assign the secondary structure of a protein based on its solved three dimensional (3D) structure.

This version (4.2) of DSSP is a rewrite that writes annotated mmCIF files by default but can still produce the older dssp format. New is also the support of PP helices.

Registry entries: Bio.tools  SciCrunch 
embassy-domainatrix
Zusätzliche EMBOSS-Kommandos zur Arbeit mit Domänen-Klassendateien
Versions of package embassy-domainatrix
ReleaseVersionArchitectures
buster0.1.660-3amd64,arm64,armhf,i386
sid0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
trixie0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
bookworm0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.1.650-1amd64,armel,armhf,i386
Debtags of package embassy-domainatrix:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, converting, editing, searching
works-with-formatplaintext
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Die DOMAINATRIX-Programme wurden von Jon Ison und Kollegen am MRC HGMP für ihre Forschung im Bereich der Proteine entwickelt. Diese sind in einem Paket nammens EMBASSY enthalten, welches z.Z. in Arbeit ist.

Anwendungen der aktuellen Veröffentlichung von domainatrix sind cathparse (generiert DCF-Dateien von »raw«-CATH-Dateien), domainnr (entfernt redundante Bereiche aus einer DCF-Datei), domainreso (entfernt Bereiche niedriger Auflösung einer DCF-Datei), domainseqs (fügt Sequenzeinträge zu einer DCF-Datei hinzu), domainsse (fügt weitere Struktureinträge zu einer DCF-Datei hinzu), scopparse (generiert eine DCF-Datei aus »raw«-SCOP-Dateien) und ssematch (sucht in einer DCF-Datei nach weiteren Strukturübereinstimmungen).

embassy-domalign
Zusätzliche EMBOSS-Befehle für Alignments mit Proteindomänen
Versions of package embassy-domalign
ReleaseVersionArchitectures
sid0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
jessie0.1.650-1amd64,armel,armhf,i386
bookworm0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
bullseye0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.660-3amd64,arm64,armhf,i386
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package embassy-domalign:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, editing
works-with-formatplaintext
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Die DOMALIGN-Programme wurden von Jon Ison et al. am MRC HGMP für deren Forschung im Bereich der Proteindomänen entwickelt. Diese Programme sind als ein EMBASSY-Paket enthalten, die Entwicklung ist jedoch noch nicht abgeschlossen.

Anwendungen der aktuellen domalign-Veröffentlichung sind allversusall (Daten von Sequenzähnlichkeiten von einem Alle-gegen-Alle-Vergleich), domalign (erstellt Alignments (DAF-Datei) für Knoten in einer DCF-Datei), domainrep (sortiert DCF-Dateien neu, um repräsentative Strukturen zu identifizieren) und seqalign (erweitert Alignments (DAF-Datei) mit Sequenzen (DHF-Datei)).

embassy-domsearch
Zusätzliche EMBOSS-Befehle zur Suche von Proteindomänen
Versions of package embassy-domsearch
ReleaseVersionArchitectures
bullseye0.1.660-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.660-4amd64,arm64,mips64el,ppc64el,riscv64
jessie0.1.650-1amd64,armel,armhf,i386
sid0.1.660-4amd64,arm64,mips64el,ppc64el,riscv64
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.1.660-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.660-3amd64,arm64,armhf,i386
Debtags of package embassy-domsearch:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Die DOMSEARCH-Programme wurden von Jon Ison und Kollegen am MRC HGMP für ihre Forschung an Proteindomänen entwickelt. Sie sind im EMBASSY-Paket als Programme in Entwicklung enthalten.

Anwendungen in dieser Veröffentlichung von DOMSEARCH sind seqfraggle (entfernt Fragmentsequenzen aus DHF-Dateien), seqnr (entfernt Redundanzen aus DHF-Dateien), seqsearch (erstellt PSI-BLAST-Treffer (DHF-Datei) aus einer DAF-Datei), seqsort (entfernt mehrdeutig klassifizierte Sequenzen aus DHF-Dateien) und seqwords (erstellt DHF-Dateien aus einer Schlagwort-Suche bei UniProt).

emboss
Europäische, quelloffene Software-Suite für Molekularbiologie
Versions of package emboss
ReleaseVersionArchitectures
bookworm6.6.0+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie6.6.0+dfsg-15amd64,arm64,mips64el,ppc64el,riscv64
sid6.6.0+dfsg-15amd64,arm64,mips64el,ppc64el,riscv64
buster6.6.0+dfsg-7amd64,arm64,armhf,i386
stretch6.6.0+dfsg-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye6.6.0+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie6.6.0+dfsg-1amd64,armel,armhf,i386
Debtags of package emboss:
fieldbiology, biology:bioinformatics, biology:molecular
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, editing, organizing, searching, text-formatting, typesetting, viewing
works-withdb
works-with-formatplaintext
Popcon: 22 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

EMBOSS ist freie, quelloffene Software und ein Analysepaket, das speziell für die Bedürfnisse der Molekularbiologie-Anwendergemeinschaft (z.B. EMBnet) entwickelt wurde. Die Software unterstützt die Bearbeitung einer Vielzahl von Datenformaten und erlaubt sogar transparente Abfragen von Sequenzdaten aus dem Internet. Durch die umfassenden Bibliotheken, die das Paket bereitstellt, ist es auch eine Plattform, die andere Wissenschaftler darin unterstützt, Software im echten Open-Source-Geist zu entwickeln und zu veröffentlichen. EMBOSS integriert zudem eine Reihe von aktuellen Paketen und Werkzeugen zur Sequenzanalyse in ein nahtloses Ganzes. EMBOSS bricht den historischen Trend zu kommerziellen Softwarepaketen.

The package is enhanced by the following packages: clustalw primer3
Please cite: Peter Rice, Ian Longden and Alan Bleasby: EMBOSS: The European Molecular Biology Open Software Suite. (PubMed) Trends in Genetics 16(6):276 - 277 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package emboss
exonerate
Generisches Werkzeug zum paarweisen Sequenzvergleich
Versions of package exonerate
ReleaseVersionArchitectures
bullseye2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.0-4amd64,arm64,armhf,i386
jessie2.2.0-6amd64,armel,armhf,i386
sid2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package exonerate:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-with-formatplaintext
Popcon: 62 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Mit Exonerate können Sie Sequenzen ab- und vergleichen. Das Programm bietet Ihnen viele Alignment-Modelle, welche entweder vollständig dynamische Programmierung oder eine Reihe von heuristischen Methoden verwenden. Ein Großteil der Funktionalität der »Wise dynamic programming suite« wurde zur Erhöhung der Effizienz in C neu geschrieben. Exonerate ist eine wesentliche Komponente bei der Erstellung der »Ensembl Genome«-Datenbanken, die Ähnlichkeitsmaße für RNA- und DNA-Sequenzen bestimmt und so allgemein »splice variants« und Codesequenzen bestimmt.

Ein »In-silico PCR«-System zur Simulation von Experimenten (Siehe auch das Handbuch von »ipcress«) wird zusammen mit »exonerate« verteilt.

Dieses Paket beinhaltet auch eine Auswahl an Werkzeugen zur Erstellung einfacher, schneller Änderungen an »fasta«-Dateien mit über 2GB Dateigröße.

Please cite: Guy C. Slater and Ewan Birney: Automated generation of heuristics for biological sequence comparison. (PubMed,eprint) BMC Bioinformatics 6(1):31 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
fastdnaml
Werkzeug zum Aufbau phylogenetischer Bäume von DNA-Sequenzen
Versions of package fastdnaml
ReleaseVersionArchitectures
buster1.2.2-14amd64,arm64,armhf,i386
stretch1.2.2-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.2-17amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.2-10amd64,armel,armhf,i386
trixie1.2.2-17amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package fastdnaml:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

FastDNAml ist abgeleitet von Joseph Felsensteins DNAML Version 3.3 (Teil seines Pakets PHYLIP). Bevor Sie fastDNAml verwenden, sollten Sie die Dokumentation für DNAML heranziehen.

FastDNAml ist der Versuch, das gleiche Problem wie DNAML effektiver zu lösen, damit größere Bäume und/oder »bootstrap«-Replikate behandelt werden können. Bei großen Teilen von fastDNAml handelt es sich lediglich um eine Neuprogrammierung der in Pascal geschriebenen PHYLIP DNAML Version 3.3 in der Sprache C.

Beachten Sie, dass die Webseite dieses Programms nicht mehr verfügbar ist und dieses Programm daher wahrscheinlich nicht mehr aktualisiert wird.

Please cite: Gary J. Olsen, Hideo Matsuda, Ray Hagstrom and Ross Overbeek: fastDNAml: a tool for construction of phylogenetic trees of DNA sequences using maximum likelihood. (PubMed,eprint) Comput Appl Biosci 10(1):41-48 (1994)
fastlink
Schnellere Version der Stammbaum-Programme von Linkage
Versions of package fastlink
ReleaseVersionArchitectures
bullseye4.1P-fix100+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.1P-fix100+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.1P-fix100+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.1P-fix100+dfsg-2amd64,arm64,armhf,i386
stretch4.1P-fix100+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.1P-fix95-3amd64,armel,armhf,i386
sid4.1P-fix100+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package fastlink:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Genkopplungsanalyse ist ein statistisches Verfahren, das zum Abbilden von Genen und zum Auffinden wahrscheinlicher Positionen von Erbfehlern verwendet wird. Es gab ein Standard-Softwarepaket zur Genkopplung namens LINKAGE. FASTLINK ist eine deutlich veränderte und verbesserte Variante der Hauptprogramme von LINKAGE. Diese laufen sequenziell deutlich schneller, können parallelisiert werden, lassen sich nach einem Computerabsturz elegant wiederherstellen und enthalten reichlich neue Dokumentationen. FASTLINK wurde in über 1000 veröffentlichten Genkopplungsstudien verwendet.

Dieses Paket enthält die folgenden Programme:

 ilink:    Optimierungsprozedur GEMINI, um einen lokal optimalen Wert
           des Theta-Vektors von Rekombinationsanteilen zu bestimmen.
 linkmap:  berechnet die Positionswertung eines Locus gegenüber einer
           Sammlung von anderen Loci.
 lodscore: vergleicht Wahrscheinlichkeiten auf lokal optimalen Theta.
 mlink:    berechnet die LOD-Scores und Risiken mit zwei oder mehreren
           Loci.
 unknown:  identifiziert mögliche Genotypen für unbekannte Personen.
Please cite: R. W. Cottingham Jr., R. M. Idury and A. A. Schaffer: Faster Sequential Genetic Linkage Computations. (PubMed,eprint) American Journal of Human Genetics 53(1):252-263 (1993)
Registry entries: SciCrunch 
fastqc
quality control for high throughput sequence data
Versions of package fastqc
ReleaseVersionArchitectures
buster0.11.8+dfsg-2all
stretch0.11.5+dfsg-6all
jessie0.11.2+dfsg-3all
sid0.12.1+dfsg-4all
bookworm0.11.9+dfsg-6all
trixie0.12.1+dfsg-4all
bullseye0.11.9+dfsg-4all
Popcon: 15 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

FastQC aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing pipelines. It provides a modular set of analyses which you can use to give a quick impression of whether your data has any problems of which you should be aware before doing any further analysis.

The main functions of FastQC are

  • Import of data from BAM, SAM or FastQ files (any variant)
  • Providing a quick overview to tell you in which areas there may be problems
  • Summary graphs and tables to quickly assess your data
  • Export of results to an HTML based permanent report
  • Offline operation to allow automated generation of reports without running the interactive application
The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
fasttree
phylogenetic trees from alignments of nucleotide or protein sequences
Versions of package fasttree
ReleaseVersionArchitectures
buster2.1.10-2amd64,arm64,armhf,i386
stretch2.1.9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.1.7-2amd64,armel,armhf,i386
trixie2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 7 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

FastTree infers approximately-maximum-likelihood phylogenetic trees from alignments of nucleotide or protein sequences. It handles alignments with up to a million of sequences in a reasonable amount of time and memory. For large alignments, FastTree is 100-1,000 times faster than PhyML 3.0 or RAxML 7.

FastTree is more accurate than PhyML 3 with default settings, and much more accurate than the distance-matrix methods that are traditionally used for large alignments. FastTree uses the Jukes-Cantor or generalized time-reversible (GTR) models of nucleotide evolution and the JTT (Jones-Taylor-Thornton 1992) model of amino acid evolution. To account for the varying rates of evolution across sites, FastTree uses a single rate for each site (the "CAT" approximation). To quickly estimate the reliability of each split in the tree, FastTree computes local support values with the Shimodaira-Hasegawa test (these are the same as PhyML 3's "SH-like local supports").

This package contains a single threaded version (fasttree) and a parallel version which uses OpenMP (fasttreMP).

Please cite: Morgan N. Price, Paramvir S. Dehal and Adam P. Arkin: FastTree 2 -- Approximately Maximum-Likelihood Trees for Large Alignments.. (PubMed,eprint) PLoS ONE 5(3):e9490 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
fitgcp
fitting genome coverage distributions with mixture models
Versions of package fitgcp
ReleaseVersionArchitectures
bullseye0.0.20150429-4all
trixie0.0.20150429-5all
sid0.0.20150429-5all
bookworm0.0.20150429-5all
buster0.0.20150429-2amd64,arm64
stretch0.0.20150429-1amd64,arm64,mips64el,ppc64el
jessie0.0.20130418-2amd64,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Genome coverage, the number of sequencing reads mapped to a position in a genome, is an insightful indicator of irregularities within sequencing experiments. While the average genome coverage is frequently used within algorithms in computational genomics, the complete information available in coverage profiles (i.e. histograms over all coverages) is currently not exploited to its full extent. Thus, biases such as fragmented or erroneous reference genomes often remain unaccounted for. Making this information accessible can improve the quality of sequencing experiments and quantitative analyses.

fitGCP is a framework for fitting mixtures of probability distributions to genome coverage profiles. Besides commonly used distributions, fitGCP uses distributions tailored to account for common artifacts. The mixture models are iteratively fitted based on the Expectation-Maximization algorithm.

Please cite: Martin S. Lindner, Maximilian Kollock, Franziska Zickmann and Bernhard Y. Renard: Analyzing genome coverage profiles with applications to quality control in metagenomics. (PubMed,eprint) Bioinformatics 29(10):1260-1267 (2013)
Registry entries: SciCrunch 
flexbar
flexible barcode and adapter removal for sequencing platforms
Versions of package flexbar
ReleaseVersionArchitectures
bookworm3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.4.0-2amd64,arm64,armhf,i386
trixie3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.50-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el
jessie2.50-1amd64,armhf,i386
bullseye3.5.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Flexbar preprocesses high-throughput sequencing data efficiently. It demultiplexes barcoded runs and removes adapter sequences. Moreover, trimming and filtering features are provided. Flexbar increases mapping rates and improves genome and transcriptome assemblies. It supports next-generation sequencing data in fasta/q and csfasta/q format from Illumina, Roche 454, and the SOLiD platform.

Parameter names changed in Flexbar. Please review scripts. The recent months, default settings were optimised, several bugs were fixed and various improvements were made, e.g. revamped command-line interface, new trimming modes as well as lower time and memory requirements.

The package is enhanced by the following packages: multiqc
Please cite: Matthias Dodt, Johannes T. Roehr, Rina Ahmed and Christoph Dieterich: FLEXBAR — Flexible Barcode and Adapter Processing for Next-Generation Sequencing Platforms. (eprint) Biology 1(3):895-905 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
freecontact
fast protein contact predictor
Versions of package freecontact
ReleaseVersionArchitectures
trixie1.0.21-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.21-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.21-3amd64,armel,armhf,i386
stretch1.0.21-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.21-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0.21-7amd64,arm64,armhf,i386
bullseye1.0.21-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

FreeContact is a protein residue contact predictor optimized for speed. Its input is a multiple sequence alignment. FreeContact can function as an accelerated drop-in for the published contact predictors EVfold-mfDCA of DS. Marks (2011) and PSICOV of D. Jones (2011).

FreeContact is accelerated by a combination of vector instructions, multiple threads, and faster implementation of key parts. Depending on the alignment, 8-fold or higher speedups are possible.

A sufficiently large alignment is required for meaningful results. As a minimum, an alignment with an effective (after-weighting) sequence count bigger than the length of the query sequence should be used. Alignments with tens of thousands of (effective) sequences are considered good input.

jackhmmer(1) from the hmmer package, or hhblits(1) from hhsuite can be used to generate the alignments, for example.

This package contains the command line tool freecontact(1).

Please cite: László Kaján, Thomas A. Hopf, Matúš Kalaš, Debora S. Marks and Burkhard Rost: FreeContact: fast and free software for protein contact prediction from residue co-evolution. BMC Bioinformatics (2014)
Topics: Structure prediction; Sequence analysis
gasic
genome abundance similarity correction
Versions of package gasic
ReleaseVersionArchitectures
trixie0.0.r19-8all
bullseye0.0.r19-7all
buster0.0.r19-4amd64
stretch0.0.r19-1amd64
jessie0.0.r18-2amd64
sid0.0.r19-8all
bookworm0.0.r19-8all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

One goal of sequencing based metagenomic analysis is the quantitative taxonomic assessment of microbial community compositions. However, the majority of approaches either quantify at low resolution (e.g. at phylum level) or have severe problems discerning highly similar species. Yet, accurate quantification on species level is desirable in applications such as metagenomic diagnostics or community comparison. GASiC is a method to correct read alignment results for the ambiguities imposed by similarities of genomes. It has superior performance over existing methods.

The package is enhanced by the following packages: gasic-examples
Please cite: Martin S. Lindner and Bernhard Y. Renard: Metagenomic abundance estimation and diagnostic testing on species level. (PubMed,eprint) Nucleic Acids Research 41(1):e10 (2013)
Registry entries: SciCrunch 
genometools
Vielseitiger Werkzeugsatz für Genomanalysen
Versions of package genometools
ReleaseVersionArchitectures
stretch1.5.9+ds-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.6.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.6.2+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye-backports-sloppy1.6.5+ds-2~bpo11+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm-backports1.6.5+ds-2~bpo12+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.6.5+ds-2.2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.5.10+ds-3amd64,arm64,armhf,i386
buster-backports1.6.1+ds-3~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.6.5+ds-2.2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.5.3-2amd64,armel,armhf,i386
Debtags of package genometools:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
uitoolkitncurses
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

GenomeTools enthält eine nützliche Werkzeugsammlung für biologische Sequenzanalysen und -darstellungen in einem einzigen Binärprogramm.

Der Werkzeugsatz beinhaltet Binärprogramme für die Bearbeitung von Sequenzen und Annotationen, Sequenzkomprimierung, Erstellung von und Zugriff auf Indexstrukturen, Darstellung von Annotationen und vieles mehr.

Please cite: Gordon Gremme, Sascha Steinbiss and Stefan Kurtz: GenomeTools: a comprehensive software library for efficient processing of structured genome annotations.. (PubMed) IEEE/ACM Transactions on Computational Biology and Bioinformatics 10(3):645-656 (2013)
Registry entries: Bio.tools 
gff2aplot
pair-wise alignment-plots for genomic sequences in PostScript
Versions of package gff2aplot
ReleaseVersionArchitectures
stretch2.0-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.0-11amd64,arm64,armhf,i386
bullseye2.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.0-7amd64,armel,armhf,i386
Debtags of package gff2aplot:
fieldbiology, biology:bioinformatics
interfacecommandline, shell
roleprogram
scopeutility
useconverting, viewing
works-withimage:vector
works-with-formatplaintext, postscript
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

A program to visualize the alignment of two genomic sequences together with their annotations. From GFF-format input files it produces PostScript figures for that alignment. The following menu lists many features of gff2aplot:

  • Comprehensive alignment plots for any GFF-feature. Attributes are defined separately so you can modify only whatsoever attributes for a given file or share same customization across different data-sets.
  • All parameters are set by default within the program, but it can be also fully configured via gff2ps-like flexible customization files. Program can handle several of such files, summarizing all the settings before producing the corresponding figure. Moreover, all customization parameters can be set via command-line switches, which allows users to play with those parameters before adding any to a customization file.
  • Source order is taken from input files, if you swap file order you can visualize alignment and its annotation with the new input arrangement.
  • All alignment scores can be visualized in a PiP box below gff2aplot area, using grey-color scale, user-defined color scale or score-dependent gradients.
  • Scalable fonts, which can also be chosen among the basic PostScript default fonts. Feature and group labels can be rotated to improve readability in both annotation axes.
  • The program is still defined as a Unix filter so it can handle data from files, redirections and pipes, writing output to standard-output and warnings to standard error.
  • gff2aplot is able to manage many physical page formats (from A0 to A10, and more -see available page sizes in its manual-), including user-defined ones. This allows, for instance, the generation of poster size genomic maps, or the use of a continuous-paper supporting plotting device, either in portrait or landscape.
  • You can draw different alignments on same alignment plot and distinguish them by using different colors for each.
  • Shape dictionary has been expanded, so that further feature shapes are now available (see manual).
  • Annotation projections through alignment plots (so called ribbons) emulate transparencies via complementary color fill patterns. This feature allows one to show color pseudo-blending when horizontal and vertical ribbons overlap.
Please cite: J. F. Abril, R. Guigó and T. Wiehe: gff2aplot: Plotting sequence comparisons. (PubMed,eprint) Bioinformatics 19(18):2477-2479 (2003)
Registry entries: Bio.tools 
gff2ps
Erstellt PostScript-Grafiken aus GFF-Dateien
Versions of package gff2ps
ReleaseVersionArchitectures
bullseye0.98l-4all
sid0.98l-6all
trixie0.98l-6all
bookworm0.98l-6all
buster0.98l-2all
stretch0.98d-5all
jessie0.98d-4all
Debtags of package gff2ps:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useconverting, viewing
works-withimage:vector
works-with-formatpostscript
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

gff2ps ist ein Skript zur Umwandlung von GFF-formatierten Datensätzen in qualitativ hochwertige eindimensionale PostScript-Plots. Diese Plots können verwendet werden, um Genomstrukturen zu vergleichen und die Ausgaben von Programmen zur Annotation von Genomen zu visualisieren. gff2ps kann sehr einfach verwendet werden, weil es davon ausgeht, dass die GFF-Datei bereits genügend Formatierungsinformationen enthält. Die Ausgabe kann aber ebenso über zusätzliche Optionen und/oder eine Konfigurationsdatei den Wünschen entsprechend angepasst werden.

Please cite: J. F. Abril and R. Guigó: gff2ps: visualizing genomic annotations.. (PubMed,eprint) Bioinformatics 16(8):743-744 (2000)
Registry entries: Bio.tools  SciCrunch 
giira
RNA-Seq driven gene finding incorporating ambiguous reads
Versions of package giira
ReleaseVersionArchitectures
stretch0.0.20140625-1amd64
buster0.0.20140625-2amd64
jessie0.0.20140210-2amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

GIIRA is a gene prediction method that identifies potential coding regions exclusively based on the mapping of reads from an RNA-Seq experiment. It was foremost designed for prokaryotic gene prediction and is able to resolve genes within the expressed region of an operon. However, it is also applicable to eukaryotes and predicts exon intron structures as well as alternative isoforms.

Please cite: Franziska Zickmann, Martin S. Lindner and Bernhard Y. Renard: GIIRA—RNA-Seq driven gene finding incorporating ambiguous reads. (PubMed,eprint) Bioinformatics (2013)
Registry entries: Bio.tools  SciCrunch 
glam2
Unterbrochene Protein-Motive aus ungeordneten Sequenzen
Versions of package glam2
ReleaseVersionArchitectures
trixie1064-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1064-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1064-3amd64,armel,armhf,i386
bookworm1064-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1064-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1064-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1064-5amd64,arm64,armhf,i386
Debtags of package glam2:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

GLAM2 ist ein Softwarepaket für das Finden von Motiven in Sequenzen, meist Aminosäuren- oder Nukleotidsequenzen. Ein Motiv ist ein wiederkehrendes Sequenzmuster: typische Beispiele sind die TATA-Box und das CAAX-Prenylierungs-Motiv. Die wichtigste Neuerung von GLAM2 ist, dass es das Einfügen und Löschen in Motiven erlaubt.

Dieses Paket enthält Programme für das Auffinden von Motiven durch einen Satz von gemeinsamen Sequenzen und den Abgleich dieser Motive mit einer Sequenzdatenbank, ebenso wie Dienste für die Konvertierung von glam2-Motiven in übliche Alignment-Formate, die Ausblendung von glam2-Motiven aus Sequenzen zur Auffindung schwächerer Motive und das Entfernen stark ähnlicher Elemente aus einem Satz von Sequenzen.

Das Paket enthält folgende Programme:

  glam2:       Auffinden von Motiven durch einen Satz von gemeinsamen
               Sequenzen;
  glam2scan:   Abgleich dieser Motive mit einer Sequenzdatenbank;
  glam2format: Konvertierung von glam2-Motiven in übliche
               Alignment-Formate;
  glam2mask:   Ausblendung von glam2-Motiven aus Sequenzen zur Auffindung
               schwächerer Motive;
  glam2-purge: Entfernen stark ähnlicher Elemente aus einem Satz von
               Sequenzen.

In diesem Binärpaket wurde die schnelle Fourier-Transformation (FFT-Fast Fourier Transformation) für das Programm glam2 integriert.

Please cite: Martin C. Frith, Neil F. W. Saunders, Bostjan Kobe and Timothy L. Bailey: Discovering Sequence Motifs with Arbitrary Insertions and Deletions. (PubMed) PLoS Computational Biology 4(5):e1000071 (2008)
Screenshots of package glam2
gmap
spliced and SNP-tolerant alignment for mRNA and short reads
Versions of package gmap
ReleaseVersionArchitectures
sid2024-10-20+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie2024-10-20+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm2021-12-17+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch2017-01-14-1 (non-free)amd64
jessie2014-10-22-1 (non-free)amd64
buster2019-01-24-1 (non-free)amd64
bullseye2021-02-22+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
upstream2024-11-20
Debtags of package gmap:
fieldbiology, biology:bioinformatics, biology:structural
roleprogram
useanalysing
Popcon: 1 users (21 upd.)*
Newer upstream!
License: DFSG free
Git

This package contains the programs GMAP and GSNAP as well as utilities to manage genome databases in GMAP/GSNAP format. GMAP (Genomic Mapping and Alignment Program) is a tool for aligning EST, mRNA and cDNA sequences. GSNAP (Genomic Short-read Nucleotide Alignment Program) is a tool for aligning single-end and paired-end transcriptome reads. Both tools can use a database of

  • known splice sites and identify novel splice sites.
  • known single-nucleotide polymorphisms (SNPs). GSNAP can align bisulfite-treated DNA.
Please cite: Thomas D. Wu and Serban Nacu: Fast and SNP-tolerant detection of complex variants and splicing in short reads. (PubMed,eprint) Bioinformatics 26(7):873-81 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
grinder
Vielseitige Simulation von -omik-Shotgun und -Amplikonsquenzierungen
Versions of package grinder
ReleaseVersionArchitectures
jessie0.5.3-3all
bookworm0.5.4-6all
bullseye0.5.4-6all
sid0.5.4-6all
trixie0.5.4-6all
buster0.5.4-5all
stretch0.5.4-1all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Das vielseitige Programm Grinder erstellt zufällige Bibliotheken aus Shotgun- und Amplikonsequenzen, die auf DNA-, RNA- oder Protein-Referenzsequenzen aus einer FASTA-Datei basieren.

Grinder kann Shotgun- und Amplikon-Datensätze der Genomik, Metagenomik, Transkriptomik, Metatranskriptomik, Proteomik und Metaproteomik aus aktuellen Sequenziertechniken wie Sanger, 454, Illumina erstellen. Diese simulierten Datensätze können die Genauigkeit von bioinformatischen Werkzeugen unter spezifischen Hypothesen testen, z.B. mit oder ohne Sequenzierfehler oder mit niedriger oder hoher Diversität. Grinder kann außerdem bei der Auswahl der Sequenziermethode für ein sequenzbasiertes Projekt helfen, etwa wie viele kurze Sequenzen sequenziert werden sollen und ob es eine Paired-End-Bibliothek sein soll oder nicht.

Please cite: Florent E. Angly, Dana Willner, Forest Rohwer, Philip Hugenholtz and Gene W. Tyson: Grinder: a versatile amplicon and shotgun sequence simulator. (PubMed,eprint) Nucleic Acids Research Epub ahead of print (2012)
Registry entries: SciCrunch 
gromacs
Molecular dynamics simulator, with building and analysis tools
Versions of package gromacs
ReleaseVersionArchitectures
stretch2016.1-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie5.0.2-1amd64,armel,armhf,i386
buster2019.1-1amd64,arm64,armhf,i386
bullseye2020.6-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2022.5-2amd64,arm64,mips64el,ppc64el,s390x
trixie2024.3-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid2024.4-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream2025.0~beta
Debtags of package gromacs:
fieldbiology, biology:structural, chemistry
interfacecommandline, x11
roleprogram
uitoolkitxlib
x11application
Popcon: 18 users (23 upd.)*
Newer upstream!
License: DFSG free
Git

GROMACS is a versatile package to perform molecular dynamics, i.e. simulate the Newtonian equations of motion for systems with hundreds to millions of particles.

It is primarily designed for biochemical molecules like proteins and lipids that have a lot of complicated bonded interactions, but since GROMACS is extremely fast at calculating the nonbonded interactions (that usually dominate simulations) many groups are also using it for research on non- biological systems, e.g. polymers.

This package contains variants both for execution on a single machine, and using the MPI interface across multiple machines.

Please cite: Berk Hess, Carsten Kutzner, David van der Spoel and Erik Lindahl: GROMACS 4: Algorithms for Highly Efficient, Load-Balanced, and Scalable Molecular Simulation. (eprint) J. Chem. Theory Comput. 4(3):435-447 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
hhsuite
Sensible Proteinsequenzsuchen, basierend auf HMM-HMM-Alignment
Versions of package hhsuite
ReleaseVersionArchitectures
bookworm3.3.0+ds-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster3.0~beta3+dfsg-3amd64
bullseye3.3.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
jessie2.0.16-5amd64
stretch3.0~beta2+dfsg-3amd64
sid3.3.0+ds-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie3.3.0+ds-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HH-suite ist ein quelloffenes Softwarepaket für sensible Proteinsequenzsuchen, basierend auf paarweisen Alignments von Hidden-Markov-Modellen (HMMe).

Dieses Paket enthält HHsearch, HHblits sowie weitere Programme und Hilfswerkzeuge.

HHsearch akzeptiert als Eingabe ein multiples Sequenzalignment (MSA) oder Profil-HMM und durchsucht eine HMM-Datenbank (z.B. PDB, Pfam oder InterPRo) nach homologen Proteinen. HHsearch wird oft bei Proteinstrukturvorhersagen verwendet, um homologe Matrizen (Templates) zu erkennen und hochakkurate paarweise Alignments mit Abfrage-Matrizen für Homology Modelling zu erstellen.

HHblits kann hochqualitative MSAs aus einzelnen Sequenzen oder aus MSAs erstellen. Es transformiert diese in ein Abfrage-HMM und fügt der aktualisierten Abfrage-HMM - mittels iterativer Suche - signifikant ähnliche Sequenzen der vorherigen Suche hinzu, um diese bei der nächsten Suchiteration zu verwenden. HHblits ist verglichen mit PSI-BLAST schneller, bis zu doppelt so sensibel und erstellt genauere Alignments.

Please cite: Michael Remmert, Andreas Biegert, Andreas Hauser and Johannes Söding: HHblits: Lightning-fast iterative protein sequence searching by HMM-HMM alignment.. (PubMed) Nat. Methods 9(2):173-175 (2011)
Registry entries: SciCrunch  Bioconda 
hisat2
graph-based alignment of short nucleotide reads to many genomes
Versions of package hisat2
ReleaseVersionArchitectures
buster2.1.0-2amd64
bullseye2.2.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.0.5-1amd64
trixie2.2.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 7 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

HISAT2 is a fast and sensitive alignment program for mapping next-generation sequencing reads (both DNA and RNA) to a population of human genomes (as well as against a single reference genome). Based on an extension of BWT for graphs a graph FM index (GFM) was designed and implementd. In addition to using one global GFM index that represents a population of human genomes, HISAT2 uses a large set of small GFM indexes that collectively cover the whole genome (each index representing a genomic region of 56 Kbp, with 55,000 indexes needed to cover the human population). These small indexes (called local indexes), combined with several alignment strategies, enable rapid and accurate alignment of sequencing reads. This new indexing scheme is called a Hierarchical Graph FM index (HGFM).

The package is enhanced by the following packages: multiqc
Please cite: Daehwan Kim, Joseph M. Paggi, Chanhee Park, Christopher Bennett and Steven L. Salzberg: Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology 37(8):907-915 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
hmmer
Profil-Hidden-Markov-Modelle für Protein-Sequenzanalyse
Versions of package hmmer
ReleaseVersionArchitectures
sid3.4+dfsg-2amd64,arm64,i386
jessie3.1b1-3amd64,armel,armhf,i386
stretch3.1b2+dfsg-5amd64,i386
buster3.2.1+dfsg-1amd64,i386
bullseye3.3.2+dfsg-1amd64,i386
bookworm3.3.2+dfsg-1amd64,i386
trixie3.4+dfsg-2amd64,arm64,i386
Debtags of package hmmer:
biologyformat:aln, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-withdb
works-with-formatplaintext
Popcon: 20 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

HMMER ist eine Implementierung der Profile-Hidden-Markov-Modelle für eine sensitive Suche in biologischen Sequenzdatenbanken mit multiplen Sequenzalignments als Anfragen.

Mit einem multiplen Sequenzalignment als Eingabe baut HMMER ein statistisches Modell, genannt »Hidden-Markov-Modell«. Mit diesem kann in Sequenzdatenbanken nach homologen Sequenzen gesucht werden. Dabei können gleichzeitig, der gesuchten Proteinfamilie zugehörige, Sequenzen alignt werden.

Please cite: S. R. Eddy: Profile hidden Markov models. (PubMed,eprint) Bioinformatics 14(9):755-763 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package hmmer
idba
iterative De Bruijn Graph short read assemblers
Versions of package idba
ReleaseVersionArchitectures
buster1.1.3-3amd64,arm64,armhf,i386
bullseye1.1.3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.1.2-1amd64,armel,armhf,i386
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

IDBA stands for iterative de Bruijn graph assembler. In computational sequence biology, an assembler solves the puzzle coming from large sequencing machines that feature many gigabytes of short reads from a large genome.

This package provides several flavours of the IDBA assembler, as they all share the same source tree but serve different purposes and evolved over time.

IDBA is the basic iterative de Bruijn graph assembler for second-generation sequencing reads. IDBA-UD, an extension of IDBA, is designed to utilize paired-end reads to assemble low-depth regions and use progressive depth on contigs to reduce errors in high-depth regions. It is a generic purpose assembler and especially good for single-cell and metagenomic sequencing data. IDBA-Hybrid is another update version of IDBA-UD, which can make use of a similar reference genome to improve assembly result. IDBA-Tran is an iterative de Bruijn graph assembler for RNA-Seq data.

Please cite: Yu Peng, Henry C. M. Leung, S. M. Yiu and Francis Y. L. Chin: IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. (PubMed,eprint) Bioinformatics 28(11):1420-1428 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
infernal
Rückschluss auf Alignments der RNA-Sekundärstruktur
Versions of package infernal
ReleaseVersionArchitectures
stretch1.1.2-1amd64,i386
jessie1.1.1-2amd64,i386
buster1.1.2-2amd64,i386
bookworm1.1.4-1amd64,i386
bullseye1.1.4-1amd64,i386
trixie1.1.5-2amd64,arm64,i386
sid1.1.5-2amd64,arm64,i386
Debtags of package infernal:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 13 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Infernal ("INFERence of RNA ALignment") durchsucht DNA-Sequenzdatenbanken nach RNA-Struktur- und Sequenzähnlichkeiten. Es stellt eine Implementierung eines Spezialfalls der stochastisch kontextfreien Grammatiken, den sogenannten Kovarianzmodellen (CMs), bereit. Ein CM ist wie ein Sequenzprofil, bewertet jedoch eine Kombination aus Sequenzübereinstimmung und Übereinstimmung sekundärer RNA-Strukturen. Daher kann ein CM in vielen Fällen eher RNA- Homologe erkennen, deren Sekundärstruktur besser konserviert ist als deren primäre Sequenz.

Dieses Werkzeug ist eine integrale Komponente der Datenbank Rfam.

Please cite: Eric P. Nawrocki, Diana L. Kolbe and Sean R. Eddy: Infernal 1.0: inference of RNA alignments. (PubMed,eprint) Bioinformatics 25(10):1335-1337 (2009)
Registry entries: SciCrunch  Bioconda 
jellyfish
Zählt k-mere in DNA-Sequenzen
Versions of package jellyfish
ReleaseVersionArchitectures
sid2.3.1-3amd64,arm64,mips64el,ppc64el,riscv64
trixie2.3.1-3amd64,arm64,mips64el,ppc64el,riscv64
stretch2.2.6-1amd64
bookworm2.3.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bullseye2.3.0-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el
jessie2.1.4-1amd64
buster2.2.10-2amd64,arm64
Popcon: 2 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

JELLYFISH ist ein Werkzeug für schnelles, speichereffizientes Zählen von k-meren in DNA. Ein k-mer ist ein Substring der Länge k. Die Vorkommen aller solcher Substrings zu zählen ist ein zentraler Schritt in vielen Analysen von DNA-Sequenzen. JELLYFISH kann k-mere mit einer Größenordnung weniger Speicher und einer Größenordnung schneller als andere Pakete zählen. Dies ist durch eine effiziente Kodierung einer Hashtabelle und durch Ausnutzung der CPU-Anweisung »Compare-and-Swap« für eine erhöhte Parallelisierung möglich.

JELLYFISH ist ein Befehlszeilenprogramm, das FASTA- und multi-FASTA-Dateien bestehend aus DNA-Sequenzen liest. Die Zählung der k-mere wird in einem Binärformat ausgegeben, das mit dem Befehl »jellyfish dump« in ein menschenlesbares Textformat übersetzt werden kann.

The package is enhanced by the following packages: multiqc
Please cite: Guillaume Marcais and Carl Kingsford: A fast, lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics 27(6):764-770 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
kalign
Globales und fortschreitendes multiples Sequenzalignment
Versions of package kalign
ReleaseVersionArchitectures
sid3.4.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.03+20110620-5amd64,arm64,armhf,i386
stretch2.03+20110620-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.03+20110620-2amd64,armel,armhf,i386
bookworm3.3.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.4.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package kalign:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 13 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Das Befehlszeilenwerkzeug Kalign gleicht mehrere biologische Sequenzen ab. Für die Erhöhung von Präzision und Geschwindigkeit nutzt es den Muth-Manber-Algorithmus, der in großen Datenmengen sich wiederholende Muster ermittelt. Das Programm verwendet einen globalen, fortschreitenden Alignment-Ansatz, ergänzt durch den Einsatz eines annähernden Musterabgleich-Algorithmus zur Berechnung von Sequenzabständen und durch die Einbeziehung lokaler Übereinstimmungen in ein ansonsten globales Alignment.

Please cite: Lassmann, Timo.: Kalign 3: multiple sequence alignment of large datasets. (eprint) Bioinformatics 36(6):1928-1929 (2020)
Registry entries: Bio.tools  SciCrunch 
kissplice
Detection of various kinds of polymorphisms in RNA-seq data
Versions of package kissplice
ReleaseVersionArchitectures
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
trixie2.6.7-1amd64,arm64,mips64el,ppc64el,riscv64
buster2.4.0-p1-4amd64,arm64
stretch2.4.0-p1-1amd64,arm64,mips64el,ppc64el
jessie2.2.1-3amd64
bullseye2.5.3-3amd64,arm64,mips64el,ppc64el
sid2.6.7-1amd64,arm64,mips64el,ppc64el,riscv64
Debtags of package kissplice:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

KisSplice is a piece of software that enables the analysis of RNA-seq data with or without a reference genome. It is an exact local transcriptome assembler that allows one to identify SNPs, indels and alternative splicing events. It can deal with an arbitrary number of biological conditions, and will quantify each variant in each condition. It has been tested on Illumina datasets of up to 1G reads. Its memory consumption is around 5Gb for 100M reads.

Please cite: Gustavo AT Sacomoto, Janice Kielbassa, Rayan Chikhi, Raluca Uricaru, Pavlos Antoniou, Marie-France Sagot, Pierre Peterlongo and Vincent Lacroix: KISSPLICE: de-novo calling alternative splicing events from RNA-seq data. (PubMed,eprint) BMC Bioinformatics 13((Suppl 6)):S5 (2012)
Registry entries: SciCrunch  Bioconda 
Topics: RNA-seq; RNA splicing; Gene structure
last-align
Vergleich biologischer Sequenzen für Genome
Versions of package last-align
ReleaseVersionArchitectures
jessie490-1amd64,armel,armhf,i386
sid1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1447-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1179-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster963-2amd64,arm64,armhf,i386
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

LAST ist eine Software für den Vergleich und die Alignierung von Sequenzen, in der Regel DNA- oder Protein-Sequenzen. LAST ähnelt BLAST, kommt jedoch besser mit sehr großen Mengen an Sequenzdaten zurecht. Hier sind zwei Dinge, die LAST gut beherrscht:

  • Vergleich großer Genome (z.B. von Säugetieren).
  • Kartierung viele Sequenz-Markierungen auf einem Genom.

Die wichtigste technische Neuerung ist, dass LAST erste Übereinstimmungen auf der Grundlage ihrer Vielfachheit findet, anstatt eine feste Größe zu verwenden (z.B. verwendet BLAST 10-mere). Dies ermöglicht es, Markierungen (Tags) ohne wiederholte Maskierung (repeat-masking) auf Genome anzuwenden, ohne durch wiederholte Treffer überschüttet zu werden. Um diese Übereinstimmungen variabler Größe zu finden, verwendet es ein von Vmatch inspiriertes Suffix-Array. Um eine hohe Empfindlichkeit zu erreichen, verwendet LAST ein nicht zusammenhängendes Suffix-Array, analog zu »spaced seeds«.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
loki
MCMC Linkage-Analyse auf allgemeine Stammbäume
Versions of package loki
ReleaseVersionArchitectures
jessie2.4.7.4-5amd64,armel,armhf,i386
stretch2.4.7.4-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.4.7.4-8amd64,arm64,armhf,i386
bullseye2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.4.7.4-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package loki:
fieldbiology
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 51 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Führt eine »multipoint linkage«-Analyse im Markov-Kette-Monte-Carlo-Verfahren für große, komplexe Stammbäume durch. Das aktuelle Paket unterstützt nur Analysen von quantitativen Merkmalen, allerdings wird diese Beschränkung in späteren Versionen aufgehoben werden. Die zusammengeführte Abschätzung der QTL-Anzahl, -Position und -Effekte nutzt »Reversible Jump«-MCMC. Es ist auch möglich, eine »affected only IBD sharing«-Analyse durchzuführen.

The package is enhanced by the following packages: loki-doc
macs
Model-based Analysis of ChIP-Seq on short reads sequencers
Versions of package macs
ReleaseVersionArchitectures
trixie3.0.2-1amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
sid3.0.2-1amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm2.2.7.1-6amd64,arm64,armel,armhf,i386,ppc64el,s390x
jessie2.0.9.1-1amd64,armel,armhf,i386
bullseye2.2.7.1-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
stretch2.1.1.20160309-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.2.1-1amd64,arm64,armhf,i386
Popcon: 6 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

MACS empirically models the length of the sequenced ChIP fragments, which tends to be shorter than sonication or library construction size estimates, and uses it to improve the spatial resolution of predicted binding sites. MACS also uses a dynamic Poisson distribution to effectively capture local biases in the genome sequence, allowing for more sensitive and robust prediction. MACS compares favorably to existing ChIP-Seq peak-finding algorithms, is publicly available open source, and can be used for ChIP-Seq with or without control samples.

Please cite: Yong Zhang, Tao Liu, Clifford A Meyer, Jérôme Eeckhoute, David S. Johnson, Bradley E. Bernstein, Chad Nussbaum, Richard M. Myers, Myles Brown, Wei Li and X Shirley Liu: Model-based Analysis of ChIP-Seq (MACS). (PubMed,eprint) Genome Biol. 9(9):R137 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mafft
Programm für multiples Alignment von Aminosäure- oder Nukleotidsequenzen
Versions of package mafft
ReleaseVersionArchitectures
trixie7.505-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye7.475-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie7.205-1amd64,armel,armhf,i386
bookworm7.505-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch7.307-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid7.505-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster7.407-2amd64,arm64,armhf,i386
upstream7.525
Debtags of package mafft:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 17 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

MAFFT ist ein Programm für multiples Alignment, das drei auf Genauigkeit ausgerichtete Methoden bietet:

  • L-INS-i (wahrscheinlich am genauesten; empfohlen für < 200 Sequenzen; iterative Verfeinerung unter Verwendung lokaler paarweiser Alignments),
  • G-INS-i (geeignet für Sequenzen ähnlicher Längen; empfohlen für < 200 Sequenzen; iterative Verfeinerung unter Verwendung globaler paarweiser Alignments),
  • E-INS-i (geeignet für Sequenzen mit großen, nicht abgleichbaren Regionen; empfohlen für < 200 Sequenzen). Auch fünf geschwindigkeitsoptimierte Methoden sind enthalten:

  • FFT-NS-i (iterative Verfeinerung,nur zwei Zyklen),

  • FFT-NS-i (iterative Verfeinerung, max. 1000 Iterationen),
  • FFT-NS-2 (schnelle, progressive Methode),
  • FFT-NS-1 (sehr schnell; empfohlen für > 2000 Sequenzen; progressive Methode mit einem groben Führungsbaum),
  • NW-NS-PartTree-1 (empfohlen für ~ 50.000 Sequenzen; progressive Methode unter Verwendung des PartTree-Algorithmus).
Please cite: Kazutaka Katoh and Hiroyuki Toh: Recent developments in the MAFFT multiple sequence alignment program. (PubMed) Brief Bioinform 9(4):286-298 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mapsembler2
bioinformatics targeted assembly software
Versions of package mapsembler2
ReleaseVersionArchitectures
bullseye2.2.4+dfsg1-3amd64,arm64,ppc64el,s390x
buster2.2.4+dfsg-3amd64,arm64,armhf,i386
stretch2.2.3+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
sid2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
jessie2.1.6+dfsg-1amd64,armel,armhf,i386
trixie2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
bookworm2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Mapsembler2 is a targeted assembly software. It takes as input a set of NGS raw reads (fasta or fastq, gzipped or not) and a set of input sequences (starters).

It first determines if each starter is read-coherent, e.g. whether reads confirm the presence of each starter in the original sequence. Then for each read-coherent starter, Mapsembler2 outputs its sequence neighborhood as a linear sequence or as a graph, depending on the user choice.

Mapsembler2 may be used for (not limited to):

  • Validate an assembled sequence (input as starter), e.g. from a de Bruijn graph assembly where read-coherence was not enforced.
  • Checks if a gene (input as starter) has an homolog in a set of reads
  • Checks if a known enzyme is present in a metagenomic NGS read set.
  • Enrich unmappable reads by extending them, possibly making them mappable
  • Checks what happens at the extremities of a contig
  • Remove contaminants or symbiont reads from a read set
Please cite: Pierre Peterlongo and Rayan Chikhi: Mapsembler, targeted and micro assembly of large NGS datasets on a desktop computer. (PubMed) BMC Bioinformatics 13:48 (2012)
Registry entries: Bio.tools  Bioconda 
maq
Kartiert kurze polymorphe DNA-Sequenzen mit fester Länge auf Referenzsequenzen
Versions of package maq
ReleaseVersionArchitectures
bookworm0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.7.1-8amd64,arm64,armhf,i386
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.7.1-5amd64,armel,armhf,i386
sid0.7.1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 7 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (kurz für Mapping and Assembly with Quality) erstellt kartierende Anordnungen von kurzen DNA-Sequenzen, wie sie von Sequenziergeräten der nächsten Generation erzeugt werden. Das Programm wurde speziell für den Illumina-Solexa 1G Genetic Analyzer entwickelt und hat eine erste Implementierung für den Umgang mit mit ABI-SOLiD-Daten. Maq war zuvor bekannt als mapass2.

Die Entwicklung von Maq wurde im Jahr 2008 eingestellt. Seine Nachfolger sind BWA und SAMtools.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
melting
Berechnet die Schmelztemperatur eines Nukleinsäure-Doppelhelix
Versions of package melting
ReleaseVersionArchitectures
bullseye5.2.0-2all
bookworm5.2.0-2all
trixie5.2.0-2all
buster5.2.0-1all
jessie4.3.1+dfsg-1amd64,armel,armhf,i386
stretch4.3.1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid5.2.0-2all
Debtags of package melting:
biologynuceleic-acids
fieldbiology, biology:molecular
interfacecommandline
roleprogram
scopeutility
suitegnu
useanalysing
works-with-formatplaintext
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Dieses Programm berechnet für einen Nukleinsäure-Doppelhelix die Enthalpie, die Entropie und die Schmelztemperatur der Helix-Coil-Übergange. Drei Arten von Hybridisierungen sind möglich: DNA/DNA, DNA/RNA und RNA/RNA. Das Programm berechnet zuerst die Hybridisierungsenthalpie und -entropie aus den elementaren Parametern eines jeden Basenpaares durch die Nearest-Neighbor-Methode. Danach wird die Schmelztemperatur berechnet. Der Satz an thermodynamischen Parametern kann leicht geändert werden, etwa nach einem experimentellen Durchbruch.

Please cite: Le Novère, Nicolas: MELTING, computing the melting temperature of nucleic acid duplex. (PubMed,eprint) Bioinformatics 17(12):1226-1227 (2001)
Registry entries: Bio.tools 
Screenshots of package melting
minia
short-read biological sequence assembler
Versions of package minia
ReleaseVersionArchitectures
bullseye3.2.1+git20200522.4960a99-1amd64,arm64,i386,mips64el,ppc64el,s390x
buster1.6906-2amd64,arm64,armhf,i386
stretch1.6906-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.6088-1amd64,armel,armhf,i386
sid3.2.6-4amd64,arm64,mips64el,ppc64el,riscv64
trixie3.2.6-4amd64,arm64,mips64el,ppc64el,riscv64
bookworm3.2.6-3amd64,arm64,mips64el,ppc64el
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

What was referred to as "next-generation" DNA sequencing up to the year 2020 delivered only "short" reads up to ~600 base pairs in length that would then have to be puzzled by random overlaps in their sequence towards a complete genome. This is the genome assembly. And there are many biological pitfalls on long stretches of low complexity regions and copy number variations and other sorts of redundancies that render this difficult.

This package provides a short-read DNA sequence assembler based on a de Bruijn graph, capable of assembling a human genome on a desktop computer in a day.

The output of Minia is a set of contigs, i.e. stretches of gap-free linear overlaps of short reads. In the best possible case this is a whole chromosome.

Minia produces results of similar contiguity and accuracy to other de Bruijn assemblers (e.g. Velvet).

Please cite: Rayan Chikhi and Guillaume Rizk: Space-Efficient and Exact de Bruijn Graph Representation Based on a Bloom Filter.. (PubMed,eprint) Algorithms for Molecular Biology 8(1):22 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
mipe
Werkzeuge zum Speichern von PCR-abgeleiteten Daten
Versions of package mipe
ReleaseVersionArchitectures
bookworm1.1-9all
jessie1.1-4all
buster1.1-7all
trixie1.1-9all
stretch1.1-5all
bullseye1.1-9all
sid1.1-9all
Debtags of package mipe:
fieldbiology, biology:bioinformatics, biology:molecular
interfacecommandline
roledocumentation, program
scopeutility
useorganizing
works-with-formatxml
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MIPE bietet ein Standardformat zum Austausch und/oder Speichern aller Daten, die mit PCR-Experimenten zusammenhängen, wobei eine einfache Textdatei verwendet wird. Dies erlaubt:

  • den Austausch von PCR-Daten zwischen Forschern/Laboren
  • eine Rückverfolgbarkeit von Daten
  • Vermeidung von Problemen beim Veröffentlichen der Daten zum dbSTS oder dbSNP
  • das Schreiben von Standardskripten, um Daten zu extrahieren (z.B. eine Liste aller PCR-Primer, SNP-Positionen oder Haplotypen unterschiedlicher Tiere)

Obwohl dieses Werkzeug für die Datenspeicherung verwendet werden kann, liegt der primäre Fokus auf dem Datenaustausch. Für die Speicherung größerer Datenmengen sind relationale Datenbanken geeigneter. Das MIPE-Format könnte in dem Fall als Standardformat zum Im- und/oder Export in/aus diesen Datenbanken dienen.

Please cite: Jan Aerts and T. Veenendaal: MIPE - a XML-format to facilitate the storage and exchange of PCR-related data. Online Journal of Bioinformatics 6(2):114-120 (2005)
Registry entries: SciCrunch 
mira-assembler
Whole Genome Shotgun and EST Sequence Assembler
Versions of package mira-assembler
ReleaseVersionArchitectures
buster4.9.6-4amd64,arm64,armhf,i386
stretch4.9.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.9.6-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.9.6-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.0.2-1amd64,armel,armhf,i386
Debtags of package mira-assembler:
roleprogram
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The mira genome fragment assembler is a specialised assembler for sequencing projects classified as 'hard' due to high number of similar repeats. For expressed sequence tags (ESTs) transcripts, miraEST is specialised on reconstructing pristine mRNA transcripts while detecting and classifying single nucleotide polymorphisms (SNP) occurring in different variations thereof.

The assembler is routinely used for such various tasks as mutation detection in different cell types, similarity analysis of transcripts between organisms, and pristine assembly of sequences from various sources for oligo design in clinical microarray experiments.

The package provides the following executables: Binaries provided:

  • mira: for assembly of genome sequences
  • miramem: estimating memory needed to assemble projects.
  • mirabait: a "grep" like tool to select reads with kmers up to 256 bases.
  • miraconvert: is a tool to convert, extract and sometimes recalculate all kinds of data related to sequence assembly files.
Please cite: Bastien Chevreux, Thomas Pfisterer, Bernd Drescher, Albert J. Driesel, Werner E. G. Müller, Thomas Wetter and Sándor Suhai: Using the miraEST Assembler for Reliable and Automated mRNA Transcript Assembly and SNP Detection in Sequenced ESTs. (PubMed,eprint) Genome Research 14(6):1147-1159 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mlv-smile
Findet statistisch signifikante Sequenzmuster
Versions of package mlv-smile
ReleaseVersionArchitectures
bullseye1.47-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.47-6amd64,arm64,armhf,i386
stretch1.47-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.47-3amd64,armel,armhf,i386
bookworm1.47-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.47-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Smile ermittelt Sequenzmotive aufgrund eines Satzes an DNA-, RNA- oder Proteinsequenzen.

  • Keine feste Grenze bei der Anzahl der Motivkombinationen, um Untergruppen von Sequenzen zu beschreiben.
  • Das Sequenzalphabet kann angegeben werden.
  • Wildcards werden unterstützt.
  • Bessere Bestimmung der Motivsignifikanz durch Simulation.
  • Einführung eines Sequenzsatzes mit negativen Kontrollen, die mit automatisch ermittelten Motiven nicht übereinstimmen sollen.
mothur
Sequenzanalysen-Suite zur Forschung an Mikrobiota
Versions of package mothur
ReleaseVersionArchitectures
trixie1.48.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.48.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.41.21-1amd64,arm64,armhf,i386
stretch1.38.1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.44.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.33.3+dfsg-2amd64,armel,armhf,i386
upstream1.48.2
Debtags of package mothur:
roleprogram
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Mothur versucht eine quelloffene, erweiterbare Software zu entwickeln, die den bioinformatischen Anforderungen der Forscher der mikrobiellen Ökologie genügt. Es vereinigt die Funktionalität von DOTUR, SONS, TreeClimber, s-libshuff, UniFrac und vielen weiteren. Mothur hat nicht nur die Flexibilität dieser Algorithmen verbessert, sondern auch eine Anzahl an neuen Fähigkeiten hinzugefügt, etwa Berechnungs- und Visualisierungswerkzeuge.

Please cite: Patrick D Schloss, Sarah L Westcott, Thomas Ryabin, Justine R Hall, Martin Hartmann, Emily B Hollister, Ryan A Lesniewski, Brian B Oakley, Donovan H Parks, Courtney J Robinson, Jason W Sahl, Blaz Stres, Gerhard G Thallinger, David J Van Horn and Carolyn F Weber: Introducing mothur: Open-source, platform-independent, community-supported software for describing and comparing microbial communities. (PubMed) Appl Environ Microbiol 75(23):7537-7541 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
mrbayes
Bayessche Inferenz der Phylogenie
Versions of package mrbayes
ReleaseVersionArchitectures
bookworm3.2.7a-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.2.3+dfsg-1amd64,armel,armhf,i386
stretch3.2.6+dfsg-1amd64,arm64,armhf,i386
buster3.2.6+dfsg-2amd64,arm64,armhf,i386
bullseye3.2.7a-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.2.7a-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.2.7a-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Die Bayessche Inferenz der Phylogenie basiert auf einer Quantität - A-posteriori-Wahrscheinlichkeitsverteilung von Bäumen genannt - die die Wahrscheinlichkeit eines Baumes bedingt durch die Beobachtungen ist. Die Bedingung entsteht durch Verwendung des Bayestheorems. Die A-posteriori-Wahrscheinlichkeitsverteilung von Bäumen kann unmöglich analytisch berechnet werden. Stattdessen verwendet MrBayes eine Simulation, das Markov-Chain-Monte-Carlo-Verfahren (kurz MCMC), um die A-posteriori-Wahrscheinlichkeiten der Bäume zu schätzen.

The package is enhanced by the following packages: mrbayes-doc
Please cite: Fredrik Ronquist, Maxim Teslenko, Paul van der Mark, Daniel L. Ayres, Aaron Darling, Sebastian Höhna, Bret Larget, Liang Liu, Marc A. Suchard and John P. Huelsenbeck: MrBayes 3.2: Efficient Bayesian Phylogenetic Inference and Model Choice across a Large Model Space. (PubMed,eprint) Systematic Biology (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package mrbayes
mummer
Effizientes Sequenzalignment vollständiger Genome
Versions of package mummer
ReleaseVersionArchitectures
bookworm3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.23+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.23+dfsg-4amd64,arm64,armhf,i386
trixie3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch3.23+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.23~dfsg-2amd64,armel,armhf,i386
upstream4.0.0.~beta5
Debtags of package mummer:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 62 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

MUMmer ist eine Umgebung für ein schnelles Alignment ganzer Genome, ob in endgültiger Form oder als noch unvollständiges Assembly. MUMmer 3.0 etwa findet alle exakten Übereinstimmungen von einer Länge von wenigstens 20 Basenpaaren zwischen einem Paar von 5 Megabyte Genomen in 13,7 Sekunden, mit einem Speicherbedarf von 78 MB auf einem 2,4GHz Linux Desktop-Computer. MUMmer kann auch unvollständige Genome alignen, es kann mit hunderten oder tausenden von sequenzierten Bereichen leicht umgehen, wie sie im Shotgun-Sequencing-Verfahren anfallen. Über das mitgelieferte Programm NUCmer sind Vergleiche zwischen zwei solcher Mengen von Sequenzen unterstützt. Sind die Spezies zu divergierend, dann kann das Programm PROCmer Alignments bestimmen, die auf den six-frame-Translationen beider Input-Sequenzen basieren.

The package is enhanced by the following packages: e-mem
Please cite: Stefan Kurtz, Adam Phillippy, Arthur L. Delcher, Michael Smoot, Martin Shumway, Corina Antonescu and Steven L. Salzberg: Versatile and open software for comparing large genomes. (PubMed) Genome Biology 5(2):R12 (2004)
Registry entries: Bio.tools  Bioconda 
Topics: Sequence analysis
Screenshots of package mummer
muscle
Multiple alignment program of protein sequences
Versions of package muscle
ReleaseVersionArchitectures
bookworm5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.8.31+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.8.1551-2amd64,arm64,armhf,i386
bullseye3.8.1551-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.8.31-1amd64,armel,armhf,i386
upstream5.3
Debtags of package muscle:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 16 users (11 upd.)*
Newer upstream!
License: DFSG free
Git

MUSCLE is a multiple alignment program for protein sequences. MUSCLE stands for multiple sequence comparison by log-expectation. In the authors tests, MUSCLE achieved the highest scores of all tested programs on several alignment accuracy benchmarks, and is also one of the fastest programs out there.

Muscle v5 is a major re-write of MUSCLE based on new algorithms.

Users should be aware that command line arguments compared to version 3.x of MUSCLE have changed!

Highest accuracy, scalable to thousands of sequences

Compared to previous versions, Muscle v5 is much more accurate, is often faster, and scales to much larger datasets. At the time of writing (late 2021), Muscle v5 has the highest scores on multiple alignment benchmarks including Balibase, Bralibase, Prefab and Balifam. It can align tens of thousands of sequences with high accuracy on a low-cost commodity computer (say, an 8-core Intel CPU with 32 Gb RAM). On large datasets, Muscle v5 is 20-30% more accurate than MAFFT and Clustal-Omega.

Alignment ensembles

Muscle v5 can generate ensembles of high-accuracy alternative alignments. All replicates have equal average accuracy on benchmark test, including the MSA made with default parameters. By comparing results of downstream analysis (trees, structure prediction...) on different replicates, you can assess the effects of alignment errors on your study.

Please cite: Robert C. Edgar: MUSCLE: multiple sequence alignment with high accuracy and high throughput. (PubMed,eprint) Nucleic Acids Research 32(5):1792-1797 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
Screenshots of package muscle
muscle3
multiple alignment program of protein sequences
Versions of package muscle3
ReleaseVersionArchitectures
trixie3.8.1551-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.8.1551-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.8.1551-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

MUSCLE is a multiple alignment program for protein sequences. MUSCLE stands for multiple sequence comparison by log-expectation. In the authors tests, MUSCLE achieved the highest scores of all tested programs on several alignment accuracy benchmarks, and is also one of the fastest programs out there.

This is version 3 of the muscle program. It is a different program than muscle version 5 which is packaged as muscle in Debian.

Please cite: Robert C. Edgar: MUSCLE: multiple sequence alignment with high accuracy and high throughput. (PubMed,eprint) Nucleic Acids Research 32(5):1792-1797 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
mustang
Struktur-Alignment mehrerer Proteine
Versions of package mustang
ReleaseVersionArchitectures
trixie3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.2.3-3amd64,arm64,armhf,i386
stretch3.2.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.2.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.2.2-1amd64,armel,armhf,i386
Debtags of package mustang:
biologypeptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing, comparing
works-with-formatplaintext
Popcon: 11 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Mustang ist ein Algorithmus, um mehrere Protein-Strukturen miteinander abzugleichen. Aus einem Satz von PDB-Dateien (Protein Data Bank, PDB) bestimmt das Programm unter Ausnutzung der räumlichen Informationen in den Calpha-Atomen die einander zuzuordnenden Aminosäuren. Dies ist für verschiedene Bereiche des Proteins auch unterschiedlich gut möglich. Anschließend werden die Proteine paarweise miteinander verglichen, und so in mehreren Durchgängen mit einer Heuristik das Ergebnis zunehmend verfeinert. Schließlich gibt Mustang die Zuordnung der Protein-Sequenzen (das Alignment) und auch die entsprechende räumliche Überlagerung von Strukturen aus.

The package is enhanced by the following packages: mustang-testdata
Please cite: Arun S. Konagurthu, James C. Whisstock, Peter J. Stuckey and Arthur M. Lesk: MUSTANG: A multiple structural alignment algorithm. (PubMed) Proteins: Structure, Function, and Bioinformatics 64(3):559-574 (2006)
Registry entries: Bio.tools 
Screenshots of package mustang
ncbi-epcr
Tool to test a DNA sequence for the presence of sequence tagged sites
Versions of package ncbi-epcr
ReleaseVersionArchitectures
trixie2.3.12-1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.3.12-1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.3.12-1-7amd64,arm64,armhf,i386
stretch2.3.12-1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.3.12-1-2amd64,armel,armhf,i386
bullseye2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package ncbi-epcr:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usechecking, searching
works-with-formatplaintext
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Electronic PCR (e-PCR) is computational procedure that is used to identify sequence tagged sites(STSs), within DNA sequences. e-PCR looks for potential STSs in DNA sequences by searching for subsequences that closely match the PCR primers and have the correct order, orientation, and spacing that could represent the PCR primers used to generate known STSs.

The new version of e-PCR implements a fuzzy matching strategy. To reduce likelihood that a true STS will be missed due to mismatches, multiple discontiguous words may be used instead of a single exact word. Each of this word has groups of significant positions separated by 'wildcard' positions that are not required to match. In addition, it is also possible to allow gaps in the primer alignments.

The main motivation for implementing reverse searching (called Reverse e-PCR) was to make it feasible to search the human genome sequence and other large genomes. The new version of e-PCR provides a search mode using a query sequence against a sequence database.

This program is retired upstream and it is suggested to use Primer-Blast

 https://www.ncbi.nlm.nih.gov/tools/primer-blast/
instead.
Please cite: Gregory D. Schuler: Sequence Mapping by Electronic PCR. (PubMed,eprint) Genome Research 7(5):541-550 (1997)
Registry entries: Bioconda 
ncbi-tools-bin
NCBI libraries for biology applications (text-based utilities)
Versions of package ncbi-tools-bin
ReleaseVersionArchitectures
bullseye6.1.20170106+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm6.1.20170106+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie6.1.20170106+dfsg2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid6.1.20170106+dfsg2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie6.1.20120620-8amd64,armel,armhf,i386
stretch6.1.20170106+dfsg1-0+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster6.1.20170106+dfsg1-0+deb10u2amd64,arm64,armhf,i386
Debtags of package ncbi-tools-bin:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
networkclient
roleprogram
sciencecalculation
scopeutility
useanalysing, calculating, converting, searching
works-withbiological-sequence
works-with-formatplaintext, xml
Popcon: 6 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

This package includes various utilities distributed with the NCBI C SDK, including the development tools asntool and errhdr (formerly of libncbi6-dev). None of the programs in this package require X; you can find the X-based utilities in the ncbi-tools-x11 package. BLAST and related tools now come from a separate source base, corresponding to the ncbi-blast+ and ncbi-blast+-legacy packages.

The package is enhanced by the following packages: mcl
Registry entries: Bio.tools  SciCrunch 
ncoils
coiled coil secondary structure prediction
Versions of package ncoils
ReleaseVersionArchitectures
stretch2002-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2002-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2002-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2002-7amd64,arm64,armhf,i386
trixie2002-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2002-4amd64,armel,armhf,i386
sid2002-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 9 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

The program predicts the coiled coil secondary structure predictions from protein sequences. The algorithm was published in Lupas, van Dyke & Stock, Predicting coiled coils from protein sequences Science, 252, 1162-1164, 1991.

Please cite: Andrei Lupas, Marc Van Dyke and Jeff Stock: Predicting coiled coils from protein sequences. (PubMed) Science 252:1162-1164 (1991)
Registry entries: Bio.tools  SciCrunch 
neobio
computes alignments of amino acid and nucleotide sequences
Versions of package neobio
ReleaseVersionArchitectures
jessie0.0.20030929-1.1all
stretch0.0.20030929-2all
buster0.0.20030929-4all
bullseye0.0.20030929-6all
bookworm0.0.20030929-6all
trixie0.0.20030929-6all
sid0.0.20030929-6all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Library and graphical user interface for pairwise sequence alignments. Implementation of the dynamic programming methods of Needleman & Wunsch (global alignment) and Smith & Waterman (local alignment).

Please cite: Maxime Crochemore, Gad M. Landau and Michal Ziv-Ukelson: A sub-quadratic sequence alignment algorithm for unrestricted cost matrices. :679-688 (2002)
Registry entries: Bio.tools 
Screenshots of package neobio
paraclu
Parametric clustering of genomic and transcriptomic features
Versions of package paraclu
ReleaseVersionArchitectures
buster9-2amd64,arm64,armhf,i386
stretch9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie9-1amd64,armel,armhf,i386
trixie10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Paraclu finds clusters in data attached to sequences. It was first applied to transcription start counts in genome sequences, but it could be applied to other things too.

Paraclu is intended to explore the data, imposing minimal prior assumptions, and letting the data speak for itself.

One consequence of this is that paraclu can find clusters within clusters. Real data sometimes exhibits clustering at multiple scales: there may be large, rarefied clusters; and within each large cluster there may be several small, dense clusters.

Please cite: Martin C. Frith, Eivind Valen, Anders Krogh, Yoshihide Hayashizaki, Piero Carninci and Albin Sandelin: A code for transcription initiation in mammalian genomes. (eprint) Genome Research 18(1):1-12 (2008)
parsinsert
Parsimonious Insertion of unclassified sequences into phylogenetic trees
Versions of package parsinsert
ReleaseVersionArchitectures
jessie1.04-1amd64,armel,armhf,i386
buster1.04-4amd64,arm64,armhf,i386
bookworm1.04-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.04-15amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
sid1.04-15amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
stretch1.04-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.04-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ParsInsert efficiently produces both a phylogenetic tree and taxonomic classification for sequences for microbial community sequence analysis. This is a C++ implementation of the Parsimonious Insertion algorithm.

The package is enhanced by the following packages: parsinsert-testdata
pdb2pqr
Preparation of protein structures for electrostatics calculations
Versions of package pdb2pqr
ReleaseVersionArchitectures
bookworm3.5.2+dfsg-3all
jessie1.9.0+dfsg-1amd64,armel,armhf,i386
bullseye2.1.1+dfsg-7+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.1.1+dfsg-5amd64,arm64,armhf,i386
sid3.6.1+dfsg-1all
trixie3.6.1+dfsg-1all
stretch2.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream3.6.2
Popcon: 10 users (11 upd.)*
Newer upstream!
License: DFSG free
Git

PDB2PQR is a Python software package that automates many of the common tasks of preparing structures for continuum electrostatics calculations. It thus provides a platform-independent utility for converting protein files in PDB format to PQR format. These tasks include:

  • Adding a limited number of missing heavy atoms to biomolecular structures
  • Determining side-chain pKas
  • Placing missing hydrogens
  • Optimizing the protein for favorable hydrogen bonding
  • Assigning charge and radius parameters from a variety of force fields
Please cite: Todd J Dolinsky, Paul Czodrowski, Hui Li, Jens E Nielsen, Jan H Jensen, Gerhard Klebe and Nathan A Baker: PDB2PQR: Expanding and upgrading automated preparation of biomolecular structures for molecular simulations. (PubMed,eprint) Nucleic Acids Research 35:W522-5 (2007)
perm
efficient mapping of short reads with periodic spaced seeds
Versions of package perm
ReleaseVersionArchitectures
bullseye0.4.0-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.4.0-1amd64,armel,armhf,i386
sid0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.4.0-4amd64,arm64,armhf,i386
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PerM is a software package which was designed to perform highly efficient genome scale alignments for hundreds of millions of short reads produced by the ABI SOLiD and Illumina sequencing platforms. Today PerM is capable of providing full sensitivity for alignments within 4 mismatches for 50bp SOLID reads and 9 mismatches for 100bp Illumina reads.

Please cite: Yangho Chen, Tade Souaiaia and Ting Chen: PerM: efficient mapping of short sequencing reads with periodic full sensitive spaced seeds. (PubMed,eprint) Bioinformatics 25(19):2514-21 (2009)
Registry entries: Bio.tools  SciCrunch 
phyml
Phylogenetic estimation using Maximum Likelihood
Versions of package phyml
ReleaseVersionArchitectures
trixie3.3.20220408-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch3.2.0+dfsg-7amd64,arm64,armhf,i386
jessie20120412-2amd64,armel,armhf,i386
sid3.3.20220408-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.3.20180621-2amd64,arm64,armhf,i386
bullseye3.3.20200621-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.3.20220408-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package phyml:
biologypeptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing, comparing
works-withbiological-sequence
Popcon: 11 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

PhyML is a software that estimates maximum likelihood phylogenies from alignments of nucleotide or amino acid sequences. It provides a wide range of options that were designed to facilitate standard phylogenetic analyses. The main strengths of PhyML lies in the large number of substitution models coupled to various options to search the space of phylogenetic tree topologies, going from very fast and efficient methods to slower but generally more accurate approaches. It also implements two methods to evaluate branch supports in a sound statistical framework (the non-parametric bootstrap and the approximate likelihood ratio test).

PhyML was designed to process moderate to large data sets. In theory, alignments with up to 4,000 sequences 2,000,000 character-long can be analyzed. In practice however, the amount of memory required to process a data set is proportional of the product of the number of sequences by their length. Hence, a large number of sequences can only be processed provided that they are short. Also, PhyML can handle long sequences provided that they are not numerous. With most standard personal computers, the “comfort zone” for PhyML generally lies around 3 to 500 sequences less than 2,000 character long.

This package also includes PhyTime.

Please cite: Stéphane Guindon: Bayesian estimation of divergence times from large sequence alignments. (PubMed,eprint) Molecular Biology and Evolution 27(8):1768-81 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package phyml
phyutility
simple analyses or modifications on both phylogenetic trees and data matrices
Versions of package phyutility
ReleaseVersionArchitectures
bookworm2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.7.3-1amd64,armel,armhf,i386
stretch2.7.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.7.3+dfsg-2amd64,arm64,armhf,i386
bullseye2.7.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Phyutility (fyoo-til-i-te) is a command line program that performs simple analyses or modifications on both trees and data matrices.

Currently it performs the following functions (to suggest another feature, submit an Issue and use the label Type-Enhancement) :

Trees

  • rerooting
  • pruning
  • type conversion
  • consensus
  • leaf stability
  • lineage movement
  • tree support

Data Matrices

  • concatenate alignments
  • genbank parsing
  • trimming alignments
  • search NCBI
  • fetch NCBI
Please cite: Stephen A. Smith and Casey W. Dunn: Phyutility: a phyloinformatics utility for trees, alignments, and molecular data. (PubMed,eprint) Bioinformatics 24(5):715-716 (2008)
picard-tools
Command line tools to manipulate SAM and BAM files
Versions of package picard-tools
ReleaseVersionArchitectures
sid3.1.1+dfsg-1all
stretch2.8.1+dfsg-1all
buster2.18.25+dfsg-2amd64
jessie1.113-1all
bullseye2.24.1+dfsg-1all
trixie3.1.1+dfsg-1all
bookworm2.27.5+dfsg-2all
upstream3.3.0
Popcon: 10 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

SAM (Sequence Alignment/Map) format is a generic format for storing large nucleotide sequence alignments. Picard Tools includes these utilities to manipulate SAM and BAM files:

 AddCommentsToBam                  FifoBuffer
 AddOrReplaceReadGroups            FilterSamReads
 BaitDesigner                      FilterVcf
 BamIndexStats                     FixMateInformation
                                   GatherBamFiles
 BedToIntervalList                 GatherVcfs
 BuildBamIndex                     GenotypeConcordance
 CalculateHsMetrics                IlluminaBasecallsToFastq
 CalculateReadGroupChecksum        IlluminaBasecallsToSam
 CheckIlluminaDirectory            LiftOverIntervalList
 CheckTerminatorBlock              LiftoverVcf
 CleanSam                          MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics    MarkDuplicates
 CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics              MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics        MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics        MergeSamFiles
 CollectInsertSizeMetrics          MergeVcfs
 CollectJumpingLibraryMetrics      NormalizeFasta
 CollectMultipleMetrics            PositionBasedDownsampleSam
 CollectOxoGMetrics                QualityScoreDistribution
 CollectQualityYieldMetrics        RenameSampleInVcf
 CollectRawWgsMetrics              ReorderSam
 CollectRnaSeqMetrics              ReplaceSamHeader
 CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics  RevertSam
 CollectTargetedPcrMetrics         SamFormatConverter
 CollectVariantCallingMetrics      SamToFastq
 CollectWgsMetrics                 ScatterIntervalsByNs
 CompareMetrics                    SortSam
 CompareSAMs                       SortVcf
 ConvertSequencingArtifactToOxoG   SplitSamByLibrary
 CreateSequenceDictionary          SplitVcfs
 DownsampleSam                     UpdateVcfSequenceDictionary
 EstimateLibraryComplexity         ValidateSamFile
 ExtractIlluminaBarcodes           VcfFormatConverter
 ExtractSequences                  VcfToIntervalList
 FastqToSam                        ViewSam
The package is enhanced by the following packages: multiqc
Please cite: Broad Institute: Picard toolkit. Broad Institute, GitHub repository (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing; Document, record and content management
plink
Werkzeugsatz für die Analyse von Zusammenhängen im gesamten Genom
Versions of package plink
ReleaseVersionArchitectures
stretch1.07-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.07-3amd64,armel,armhf,i386
sid1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.07+dfsg-2amd64,arm64,armhf,i386
bullseye1.07+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package plink:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
Popcon: 34 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Plink erwartet als Eingabe die Daten aus SNP-Chips (Single Nucleotide Polymorphismus) von vielen einzelnen Individuen und deren phänotypische Beschreibung einer Krankheit. Das Programm findet Verbindungen von einzelnen oder Paaren von DNA-Varianten mit einem Phänotyp. Es kann SNP-Erläuterungen aus einer Online-Quelle abrufen.

SNPs können einzeln oder als Paar auf ihren Zusammenhang mit Krankheitsphänotypen bewertet werden. Die gemeinsame Untersuchung von Varianten von Genkopien wird unterstützt. Eine Vielzahl von statistischen Tests wurde implementiert.

Bitte beachten Sie: Die ausführbare Anwendung wurde wegen eines Namenskonflikts zu plink1 umbenannt. Mehr dazu unter /usr/share/doc/plink/README.Debian.

Please cite: Shaun Purcell, Benjamin Neale, Kathe Todd-Brown, Lori Thomas, Manuel A. R. Ferreira, David Bender, Julian Maller, Pamela Sklar, Paul I. W. de Bakker, Mark J. Daly and Pak C. Sham: PLINK: a toolset for whole-genome association and population-based linkage analysis. (PubMed) American Journal of Human Genetics 81(3):559-75 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
plink1.9
Werkzeugsatz für die Analyse von Zusammenhängen im gesamten Genom
Versions of package plink1.9
ReleaseVersionArchitectures
stretch1.90~b3.45-170113-1amd64,armel,armhf,i386,mipsel
sid1.90~b7.2-231211-1amd64,armel,armhf,i386
bullseye1.90~b6.21-201019-1amd64,armel,armhf,i386,mipsel
trixie1.90~b7.2-231211-1amd64,armel,armhf,i386
bookworm1.90~b6.26-220402-1amd64,armel,armhf,i386,mipsel
buster1.90~b6.6-181012-1amd64,armhf,i386
Popcon: 92 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Plink erwartet als Eingabe die Daten aus SNP-Chips (Single Nucleotide Polymorphismus) von vielen einzelnen Individuen und deren phänotypische Beschreibung einer Krankheit. Das Programm findet Verbindungen von einzelnen oder Paaren von DNA-Varianten mit einem Phänotyp. Es kann SNP-Erläuterungen aus einer Online-Quelle abrufen.

SNPs können einzeln oder als Paar auf ihren Zusammenhang mit Krankheitsphänotypen bewertet werden. Die gemeinsame Untersuchung von Varianten von Genkopien wird unterstützt. Eine Vielzahl von statistischen Tests wurde implementiert.

Plink1.9 ist eine umfassende Aktualisierung von plink mit neuen Algorithmen und neuen Methoden, schneller und sparsamer im Speicherverbrauch als das erste plink.

Bitte beachten Sie: Die ausführbare Anwendung wurde wegen eines Namenskonflikts zu plink1.9 umbenannt. Mehr dazu unter /usr/share/doc/plink1.9/README.Debian.

Please cite: Christopher C. Chang, Carson C. Chow, Laurent C.A.M. Tellier, Shashaank Vattikuti, Shaun M. Purcell and James J. Lee: Second-generation PLINK: rising to the challenge of larger and richer datasets. (eprint) GigaScience 4(1):7 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
plink2
whole-genome association analysis toolset
Versions of package plink2
ReleaseVersionArchitectures
bullseye2.00~a3-210203+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.00~a5.8-231123+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.00~a5.8-231123+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.00~a3.5-220809+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

plink expects as input the data from SNP (single nucleotide polymorphism) chips of many individuals and their phenotypical description of a disease. It finds associations of single or pairs of DNA variations with a phenotype and can retrieve SNP annotation from an online source.

SNPs can evaluated individually or as pairs for their association with the disease phenotypes. The joint investigation of copy number variations is supported. A variety of statistical tests have been implemented.

plink2 is a comprehensive update of plink and plink1.9 with new algorithms and new methods, faster and less memory consumer than the first plink.

Please cite: Christopher C. Chang, Carson C. Chow, Laurent C.A.M. Tellier, Shashaank Vattikuti, Shaun M. Purcell and James J. Lee: Second-generation PLINK: rising to the challenge of larger and richer datasets. (eprint) GigaScience 4(1):7 (2015)
Registry entries: SciCrunch 
poa
Partial Order Alignment for multiple sequence alignment
Versions of package poa
ReleaseVersionArchitectures
bookworm2.0+20060928-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0+20060928-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.0+20060928-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.0+20060928-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.0+20060928-7amd64,arm64,armhf,i386
stretch2.0+20060928-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.0+20060928-3amd64,armel,armhf,i386
Debtags of package poa:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
works-with-formatplaintext
Popcon: 9 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

POA is Partial Order Alignment, a fast program for multiple sequence alignment (MSA) in bioinformatics. Its advantages are speed, scalability, sensitivity, and the superior ability to handle branching / indels in the alignment. Partial order alignment is an approach to MSA, which can be combined with existing methods such as progressive alignment. POA optimally aligns a pair of MSAs and which therefore can be applied directly to progressive alignment methods such as CLUSTAL. For large alignments, Progressive POA is 10-30 times faster than CLUSTALW.

Registry entries: Bioconda 
Screenshots of package poa
prank
Probabilistic Alignment Kit for DNA, codon and amino-acid sequences
Versions of package prank
ReleaseVersionArchitectures
bookworm0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.0.170427+dfsg-2amd64,arm64,armhf,i386
jessie0.0.140110-1amd64,armel,armhf,i386
stretch0.0.150803-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 11 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

PRANK is a probabilistic multiple alignment program for DNA, codon and amino-acid sequences. It's based on a novel algorithm that treats insertions correctly and avoids over-estimation of the number of deletion events. In addition, PRANK borrows ideas from maximum likelihood methods used in phylogenetics and correctly takes into account the evolutionary distances between sequences. Lastly, PRANK allows for defining a potential structure for sequences to be aligned and then, simultaneously with the alignment, predicts the locations of structural units in the sequences.

PRANK is a command-line program for UNIX-style environments but the same sequence alignment engine is implemented in the graphical program PRANKSTER. In addition to providing a user-friendly interface to those not familiar with Unix systems, PRANKSTER is an alignment browser for alignments saved in the HSAML format. The novel format allows for storing all the information generated by the aligner and the alignment browser is a convenient way to analyse and manipulate the data.

PRANK aims at an evolutionarily correct sequence alignment and often the result looks different from ones generated with other alignment methods. There are, however, cases where the different look is caused by violations of the method's assumptions. To understand why things may go wrong and how to avoid that, read this explanation of differences between PRANK and traditional progressive alignment methods.

Please cite: Ari Löztznoja: Phylogeny-aware alignment with PRANK. (PubMed) Methods Mol. Biol. 1079:155-170 (2014)
Registry entries: Bio.tools  Bioconda 
Screenshots of package prank
prime-phylo
bayesian estimation of gene trees taking the species tree into account
Versions of package prime-phylo
ReleaseVersionArchitectures
trixie1.0.11-12amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.0.11-13amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie1.0.11-2amd64,armel,armhf,i386
stretch1.0.11-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.11-7amd64,arm64,armhf,i386
bullseye1.0.11-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.11-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

PrIME (Probabilistic Integrated Models of Evolution) is a package supporting inference of evolutionary parameters in a Bayesian framework using Markov chain Monte Carlo simulation. A distinguishing feature of PrIME is that the species tree is taken into account when analyzing gene trees.

The input data to PrIME is a multiple sequence alignment in FASTA format and the output data contains trees in Newick format.

Please cite: Ö. Åkerborg, B. Sennblad, L. Arvestad and J. Lagergren: Simultaneous Bayesian gene tree reconstruction and reconciliation analysis. (PubMed,eprint) Proceedings of the National Academy of Sciences 106(14):5714-5719 (2009)
Registry entries: Bio.tools 
primer3
tool to design flanking oligo nucleotides for DNA amplification
Versions of package primer3
ReleaseVersionArchitectures
sid2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.3.6-1amd64,armel,armhf,i386
stretch2.3.7-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.4.0-2amd64,arm64,armhf,i386
bullseye2.4.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package primer3:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
works-with-formatplaintext
Popcon: 14 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Primer3 picks primers for Polymerase Chain Reactions (PCRs), considering as criteria oligonucleotide melting temperature, size, GC content and primer-dimer possibilities, PCR product size, positional constraints within the source sequence, and miscellaneous other constraints. All of these criteria are user-specifiable as constraints, and some are specifiable as terms in an objective function that characterizes an optimal primer pair.

Please cite: Steve Rozen and Helen J. Skaletsky: Primer3 on the WWW for general users and for biologist programmers. (PubMed,eprint) Methods Mol Biol. 132(3):365-86 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package primer3
probabel
Werkzeugsatz für genomweite Assoziationsanalyse
Versions of package probabel
ReleaseVersionArchitectures
buster0.5.0+dfsg-3amd64,arm64,armhf,i386
stretch0.4.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm0.5.0+dfsg-6amd64,i386
bullseye0.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.5.0+dfsg-6amd64,i386
sid0.5.0+dfsg-6amd64,i386
jessie0.4.3-2amd64,armel,armhf,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Das Paket ProbABEL ist ein Teil des Projekts GenABEL zur Analyse genomweiter Daten. ProbABEL wird verwendet, um GWAS zu nutzen. Die Nutzung von Dateien im DatABEL-Format (filevector) ermöglicht sogar die Ausführung von GWAS auf Computern mit nur wenigen Gigabyte RAM.

The package is enhanced by the following packages: probabel-examples
Please cite: Yurii S Aulchenko, Maksim V Struchalin and Cornelia M van Duijn: ProbABEL package for genome-wide association analysis of imputed data.. (PubMed,eprint) BMC Bioinformatics 11:134 (2010)
Registry entries: Bio.tools  SciCrunch 
probcons
PROBabilistic CONSistency-based multiple sequence alignment
Versions of package probcons
ReleaseVersionArchitectures
stretch1.12-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.12-9amd64,armel,armhf,i386
sid1.12-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.12-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.12-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.12-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.12-12amd64,arm64,armhf,i386
Debtags of package probcons:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 13 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Tool for generating multiple alignments of protein sequences. Using a combination of probabilistic modeling and consistency-based alignment techniques, PROBCONS has achieved the highest accuracies of all alignment methods to date. On the BAliBASE benchmark alignment database, alignments produced by PROBCONS show statistically significant improvement over current programs, containing an average of 7% more correctly aligned columns than those of T-Coffee, 11% more correctly aligned columns than those of CLUSTAL W, and 14% more correctly aligned columns than those of DIALIGN.

Please cite: Chuong B. Do, Mahathi S.P. Mahabhashyam, Michael Brudno and Serafim Batzoglou: ProbCons: Probabilistic consistency-based multiple sequence alignment. (PubMed,eprint) Genome Research 15(2):330-340 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package probcons
proda
Mulitple Alignments von Proteinsequenzen
Versions of package proda
ReleaseVersionArchitectures
jessie1.0-8amd64,armel,armhf,i386
bullseye1.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0-12amd64,arm64,armhf,i386
stretch1.0-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package proda:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 11 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

ProDA ist ein System zur automatischen Erkennung und Anordnung von homologen Regionen in Proteinsammlungen mit beliebigen Domain-Architekturen. Bei gegebenem Eingangssatz von nicht-angeordneten Sequenzen identifiziert ProDA eine homologe Region, die in einer oder mehrere Sequenzen auftaucht und liefert eine Sammlung von lokalen multiplen Anordnungen für diese Regionen zurück.

Please cite: Tu Minh Phuong, Chuong B. Do, Robert C. Edgar and Serafim Batzoglou: Multiple alignment of protein sequences with repeats and rearrangements. (PubMed,eprint) Nucl. Acids Res. 34(20):5932-5942 (2006)
Registry entries: Bio.tools  Bioconda 
Screenshots of package proda
prodigal
Microbial (bacterial and archaeal) gene finding program
Versions of package prodigal
ReleaseVersionArchitectures
stretch2.6.3-1amd64,arm64,armel,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.6.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.6.1-1amd64,armel,i386
buster2.6.3-4amd64,arm64,armhf,i386
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Prodigal (Prokaryotic Dynamic Programming Genefinding Algorithm) is a microbial (bacterial and archaeal) gene finding program developed at Oak Ridge National Laboratory and the University of Tennessee. Key features of Prodigal include:

Speed: Prodigal is an extremely fast gene recognition tool (written in very vanilla C). It can analyze an entire microbial genome in 30 seconds or less.

Accuracy: Prodigal is a highly accurate gene finder. It correctly locates the 3' end of every gene in the experimentally verified Ecogene data set (except those containing introns). It possesses a very sophisticated ribosomal binding site scoring system that enables it to locate the translation initiation site with great accuracy (96% of the 5' ends in the Ecogene data set are located correctly).

Specificity: Prodigal's false positive rate compares favorably with other gene identification programs, and usually falls under 5%.

GC-Content Indifferent: Prodigal performs well even in high GC genomes, with over a 90% perfect match (5'+3') to the Pseudomonas aeruginosa curated annotations.

Metagenomic Version: Prodigal can run in metagenomic mode and analyze sequences even when the organism is unknown.

Ease of Use: Prodigal can be run in one step on a single genomic sequence or on a draft genome containing many sequences. It does not need to be supplied with any knowledge of the organism, as it learns all the properties it needs to on its own.

Please cite: Doug Hyatt, Gwo-Liang Chen, Philip F. Locascio, Miriam L. Land, Frank W. Larimer and Loren J. Hauser: Prodigal: prokaryotic gene recognition and translation initiation site identification. (PubMed,eprint) BMC Bioinformatics 11:119 (2010)
Registry entries: SciCrunch  Bioconda 
python3-biomaj3-cli
BioMAJ client
Versions of package python3-biomaj3-cli
ReleaseVersionArchitectures
sid3.1.11-5all
trixie3.1.11-5all
bookworm3.1.11-4all
bullseye3.1.11-1all
buster3.1.10-1all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

BioMAJ downloads remote data banks, checks their status and applies transformation workflows, with consistent state, to provide ready-to-use data for biologists and bioinformaticians. For example, it can transform original FASTA files into BLAST indexes. It is very flexible and its post-processing facilities can be extended very easily.

BioMAJ3 is a rewrite of BioMAJ v1.x, see online documentation for migration.

This package contains the client to execute BioMAJ3 or communicate with the BioMAJ daemon process (python3-biomaj3-daemon) in case of microservice config.

python3-biopython
Python-3-Bibliothek für die Bioinformatik
Versions of package python3-biopython
ReleaseVersionArchitectures
buster1.73+dfsg-1amd64,arm64,armhf,i386
stretch1.68+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.64+dfsg-5amd64,armel,armhf,i386
sid1.84+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.84+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.80+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.78+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 61 users (42 upd.)*
Versions and Archs
License: DFSG free
Git

Das Projekt Biopython ist eine internationale Vereinigung von Entwicklern frei verfügbarer Python-Werkzeuge für rechnergestützte Molekularbiologie.

Es ist eine verteilte, gemeinsame Anstrengung zur Entwicklung von Python-3-Bibliotheken und -Applikationen, die auf die Anforderungen der aktuellen und zukünftigen Arbeit in der Bioinformatik zugeschnitten sind. Der Quelltext ist unter der »Biopython License« verfügbar, welche sehr liberal ist und kompatibel mit fast jeder Lizenz auf der Welt. Das Projekt arbeitet zusammen mit der Open Bioinformatics Foundation, die für das Projekt Speicherplatz für CVS und für die Webseiten bereitstellt.

Please cite: Peter J. A. Cock, Tiago Antao, Jeffrey T. Chang, Brad A. Chapman, Cymon J. Cox, Andrew Dalke, Iddo Friedberg, Thomas Hamelryck, Frank Kauff, Bartek Wilczynski and Michiel J. L. de Hoon: Biopython: freely available Python tools for computational molecular biology and bioinformatics. (PubMed,eprint) Bioinformatics 25(11):1422-1423 (2009)
Registry entries: Bio.tools  SciCrunch 
python3-cogent3
Rahmenwerk für genomische Biologie
Versions of package python3-cogent3
ReleaseVersionArchitectures
bullseye2020.12.21a+dfsg-4+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2023.2.12a1+dfsg-2+deb12u1amd64,arm64,mips64el,ppc64el,s390x
sid2023.12.15a1+dfsg-1s390x
sid2024.5.7a1+dfsg-3amd64,arm64,mips64el,ppc64el
upstream2024.7.19a9
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

PyCogent ist eine Softwarebibliothek für genomische Biologie. Es ist ein vollständig integriertes und ausführlich getestetes Rahmenwerk für:

  • Kontrolle von Drittanwendungen
  • Entwickeln von Arbeitsabläufen; Abfragen von Datenbanken
  • Durchführen neuartiger probabilistischer Analysen biologischer Sequenzevolution, und
  • Erstellen von Grafiken in Publikationsqualität Es hebt sich durch viele einzigartige eingebaute Fähigkeiten hervor (wie z.B. »true codon alignment«) und eine häufige Ergänzung komplett neuer Methoden für die Analyse genomischer Daten.
Please cite: Rob Knight, Peter Maxwell, Amanda Birmingham, Jason Carnes, J Gregory Caporaso, Brett C Easton, Michael Eaton, Micah Hamady, Helen Lindsay, Zongzhi Liu, Catherine Lozupone, Daniel McDonald, Michael Robeson, Raymond Sammut, Sandra Smit, Matthew J Wakefield, Jeremy Widmann, Shandy Wikman, Stephanie Wilson, Hua Ying and Gavin A Huttley: PyCogent: a toolkit for making sense from sequence. (PubMed,eprint) Genome Biology 8(8):R171 (2007)
Registry entries: Bio.tools  Bioconda 
qiime
Quantitative Insights Into Microbial Ecology
Versions of package qiime
ReleaseVersionArchitectures
sid2024.5.0-1all
bookworm2022.11.1-2all
jessie1.8.0+dfsg-4amd64,armel,armhf,i386
bullseye2020.11.1-1all
upstream2024.10.1
Debtags of package qiime:
roleprogram
Popcon: 23 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Microbes are surrounding us, animals, plants and all their parasites with strong effect on these and the environment these live in. Soil quality comes to mind but also the effect that bacteria have on each other. Humans are influencing the absolute and relative abundance of bacteria by antibiotics, food, fertilizers - you name it - and these changes affect us.

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (PubMed,eprint) Nature Biotechnology 37:852 - 857 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
r-bioc-edger
Empirische Analyse von digitalen Genexpressionsdaten mit R
Versions of package r-bioc-edger
ReleaseVersionArchitectures
jessie3.8.2+dfsg-1amd64,armel,armhf,i386
bookworm3.40.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.2.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid4.2.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch3.14.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.32.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream4.4.0
Popcon: 23 users (11 upd.)*
Newer upstream!
License: DFSG free
Git

Bioconductor-Paket zur Differentialexpressionsanalyse eines vollkommen sequenzierten Transkriptom (RNA-seq) und digitalen Genexpressionsprofilen mit biologischer Replikation. Es verwendet empirische Bayes-Methoden und exakte Tests, die auf der negativen Binomialverteilung basieren. Es ist auch für die Differentialsignalanalyse mit anderen Typen von Zähldaten in der Größenordnung von Genomen verwendbar.

Please cite: Mark D. Robinson, Davis J. McCarthy and Gordon K. Smyth: edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. (PubMed,eprint) Bioinformatics 26,:139-140 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-hilbertvis
GNU-R-Paket zur Visualisierung langer Datenvektoren
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
bullseye1.48.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.62.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.62.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.56.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.40.0-1amd64,arm64,armhf,i386
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.24.0-1amd64,armel,armhf,i386
upstream1.64.0
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 4 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Dieses Werkzeug ermöglicht die Anzeige sehr langer Datenvektoren auf platzsparende Weise, indem die Daten entlang einer 2D-Hilbert-Kurve angeordnet werden. Der Benutzer kann dann gleichzeitig visuell sowohl die großräumige Struktur und die Verteilung der Merkmale als auch die ungefähre Form und die Intensität der einzelnen Merkmale beurteilen.

In der Bioinformatik ist ein typischer Anwendungsfall ChIP-Chip und ChIP-Seq, oder grundsätzlich alle Arten von genomischen Daten, die konventionell als quantitative Spur (»wiggle-Daten«) von Genom-Browsern angezeigt werden, wie sie von Ensembl oder UCSC bereitgestellt werden.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-cran-pvclust
Hierarchical Clustering with P-Values via Multiscale Bootstrap
Versions of package r-cran-pvclust
ReleaseVersionArchitectures
stretch2.0-0-1all
buster2.0-0-4all
trixie2.2-0-2all
sid2.2-0-2all
jessie1.3-0-1all
bookworm2.2-0-2all
bullseye2.2-0-2all
Popcon: 48 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

pvclust is a package for assessing the uncertainty in hierarchical cluster analysis. It provides AU (approximately unbiased) p-values as well as BP (boostrap probability) values computed via multiscale bootstrap resampling.

Please cite: Ryota Suzuki and Hidetoshi Shimodaira: Pvclust: an R package for assessing the uncertainty in hierarchical clustering. (PubMed,eprint) Bioinformatics 22(12):1540-1542 (2006)
r-cran-qtl
GNU R package for genetic marker linkage analysis
Versions of package r-cran-qtl
ReleaseVersionArchitectures
jessie1.33-7-1amd64,armel,armhf,i386
trixie1.70-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.70-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.58-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.40-8-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.44-9-1amd64,arm64,armhf,i386
bullseye1.47-9-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package r-cran-qtl:
devellang:r, library
fieldbiology, statistics
roleapp-data
suitegnu
Popcon: 17 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

R/qtl is an extensible, interactive environment for mapping quantitative trait loci (QTLs) in experimental crosses. It is implemented as an add-on-package for the freely available and widely used statistical language/software R (see http://www.r-project.org).

The development of this software as an add-on to R allows one to take advantage of the basic mathematical and statistical functions, and powerful graphics capabilities, that are provided with R. Further, the user will benefit by the seamless integration of the QTL mapping software into a general statistical analysis program. The goal is to make complex QTL mapping methods widely accessible and allow users to focus on modeling rather than computing.

A key component of computational methods for QTL mapping is the hidden Markov model (HMM) technology for dealing with missing genotype data. The main HMM algorithms, with allowance for the presence of genotyping errors, for backcrosses, intercrosses, and phase-known four-way crosses were implemented.

The current version of R/qtl includes facilities for estimating genetic maps, identifying genotyping errors, and performing single-QTL genome scans and two-QTL, two-dimensional genome scans, by interval mapping (with the EM algorithm), Haley-Knott regression, and multiple imputation. All of this may be done in the presence of covariates (such as sex, age or treatment). One may also fit higher-order QTL models by multiple imputation.

Please cite: Karl W. Broman, Hao Wu, Saunak Sen and Gary A. Churchill: R/qtl: QTL mapping in experimental crosses. (PubMed,eprint) Bioinformatics 19:889-890 (2003)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-cran-vegan
Community Ecology Package for R
Versions of package r-cran-vegan
ReleaseVersionArchitectures
bullseye2.5-7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.0-10-1amd64,armel,armhf,i386
buster2.5-4+dfsg-3amd64,arm64,armhf,i386
sid2.6-8+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.6-8+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.6-4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.4-2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 158 users (92 upd.)*
Versions and Archs
License: DFSG free
Git

R package for community ecologists. It contains most multivariate analysis needed in analysing ecological communities, and tools for diversity analysis. Most diversity methods assume that data are counts of individuals.

These tools are sometimes used outside the field of ecology, for instance to study populations of white blood cells or RNA molecules.

Registry entries: SciCrunch 
r-other-mott-happy.hbrem
GNU R package for fine-mapping complex diseases
Versions of package r-other-mott-happy.hbrem
ReleaseVersionArchitectures
trixie2.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.4-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4-3amd64,arm64,armhf,i386
stretch2.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4-1amd64,armel,armhf,i386
sid2.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Happy is an R interface into the HAPPY C package for fine-mapping Quantitative Trait Loci (QTL) in Heterogenous Stocks (HS). An HS is an advanced intercross between (usually eight) founder inbred strains of mice. HS are suitable for fine-mapping QTL. It uses a multipoint analysis which offers significant improvements in statistical power to detect QTLs over that achieved by single-marker association.

The happy package is an extension of the original C program happy; it uses the C code to compute the probability of descent from each of the founders, at each locus position, but the happy packager allows a much richer range of models to be fit to the data.

Read /usr/share/doc/r-other-mott-happy/README.Debian for a more detailed explanation.

Please cite: Richard Mott, Christopher J. Talbot, Maria G. Turri, Allan C. Collins and Jonathan Flint: A method for fine mapping quantitative trait loci in outbred animal stocks. (PubMed,eprint) Proc. Natl. Acad. Sci. USA 97(23):12649-12654 (2000)
Registry entries: SciCrunch 
raster3d
Werkzeuge zum Erstellen von hochqualitativen Rasterbildern von Proteinen oder anderen Molekülen
Versions of package raster3d
ReleaseVersionArchitectures
stretch3.0-3-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.0-3-1amd64,armel,armhf,i386
bookworm3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0-3-5amd64,arm64,armhf,i386
Debtags of package raster3d:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeapplication
useconverting, viewing
works-with3dmodel, image, image:raster
works-with-formatjpg, png
Popcon: 7 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Raster3D ist eine Sammlung von Werkzeugen zum Erstellen von hochqualitativen Rasterbildern von Proteinen oder anderen Molekülen. Das Kernprogramm kann Kugeln, Dreiecke, Zylinder und Quadrik-Flächen mit Spiegelglanzlicht, Phong Shading und Schatten rendern. Es wird ein effizienter Z-Puffer-Algorithmus verwendet, der unabhängig von sämtlicher Grafikhardware ist. Zusatzprogramme verarbeiten anhand von PDB-Dateien die Koordinaten der einzelnen Atome und geben Renderingangaben für Bilder aus, die aus Schleifen, raumfüllenden Atomen, Atombindungen, »ball+stick« (Kugel+Stab) etc. zusammengestellt sein können. Raster3D kann auch dazu verwendet werden, Bilder, die mit anderen Programmen wie Molscript zusammengestellt wurden, in wunderbarem 3D mit Glanzlicht und Schatten usw. zu rendern. Die Ausgabe erfolgt in Pixelbilddateien mit 24 Bit Farbinformation per Pixel.

Please cite: E.A. Merritt and D.J. Bacon: Raster3D Photorealistic Molecular Graphics. (PubMed) Methods in Enzymology 277:505-524 (1997)
Registry entries: Bio.tools 
readseq
Umwandlung von Sequenzformaten
Versions of package readseq
ReleaseVersionArchitectures
stretch1-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1-11amd64,armel,armhf,i386
buster1-13amd64,arm64,armhf,i386
Debtags of package readseq:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useconverting
works-with-formatplaintext
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Liest und schreibt Zellkern-/Protein-Sequenzen in diversen Formaten. Datendateien können mehrere Sequenzen enthalten. Readseq ist besonders nützlich, weil es automatisch viele Sequenzformate erkennt und zwischen diesen umwandelt.

Please cite: Don Gilbert: Sequence file format conversion with command-line readseq. (PubMed,eprint) Current Protocols in Bioinformatics Appendix 1:E (2003)
Registry entries: Bio.tools  Bioconda 
rnahybrid
Schnelle und effektive Vorhersage von microRNA/Vergleichsmuster-Duplexen
Versions of package rnahybrid
ReleaseVersionArchitectures
sid2.1.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.1.2-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.1.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.1.2-5amd64,arm64,armhf,i386
bullseye2.1.2-6amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.2-7amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.1.1-2amd64,armel,armhf,i386
Debtags of package rnahybrid:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

RNAhybrid ist ein Werkzeug für die Suche nach der Hybridisierung einer langen und einer kurzen RNA mit minimaler freier Energie. Die Hybridisierung wird in einer Art von Domain-Modus durchgeführt, d.h. die kurze Sequenz wird so hybridisiert, dass sie sich am möglichst komplementären Bereich der Langen anlagert. Das Werkzeug ist in erster Linie als Mittel zur »microRNA target«-Vorhersage gedacht.

Please cite: Marc Rehmsmeier, Peter Steffen, Matthias Höchsmann and Robert Giegerich: Fast and effective prediction of microRNA/target duplexes. (PubMed,eprint) RNA 10(10):1507-1517 (2004)
Registry entries: Bio.tools  SciCrunch 
rtax
Classification of sequence reads of 16S ribosomal RNA gene
Versions of package rtax
ReleaseVersionArchitectures
buster0.984-6all
bullseye0.984-7all
bookworm0.984-8all
trixie0.984-8all
sid0.984-8all
jessie0.984-2all
stretch0.984-5all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Short-read technologies for microbial community profiling are increasingly popular, yet previous techniques for assigning taxonomy to paired-end reads perform poorly. RTAX provides rapid taxonomic assignments of paired-end reads using a consensus algorithm.

Please cite: David A. W. Soergel, Neelendu Dey, Rob Knight and Steven E. Brenner: Selection of primers for optimal taxonomic classification of environmental 16S rRNA gene sequences. (PubMed,eprint) The ISME Journal 6:1440–1444 (2012)
samtools
processing sequence alignments in SAM, BAM and CRAM formats
Versions of package samtools
ReleaseVersionArchitectures
jessie0.1.19-1amd64,armhf,i386
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
buster1.9-4amd64,arm64,armhf
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bookworm1.16.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.20-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.20-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental1.21-0+exp1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream1.21
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 57 users (30 upd.)*
Newer upstream!
License: DFSG free
Git

Samtools is a set of utilities that manipulate nucleotide sequence alignments in the binary BAM format. It imports from and exports to the ascii SAM (Sequence Alignment/Map) and CRAM formats, does sorting, merging and indexing, and allows one to retrieve reads in any regions swiftly. It is designed to work on a stream, and is able to open a BAM or CRAM (not SAM) file on a remote FTP or HTTP server.

The package is enhanced by the following packages: libbio-samtools-perl multiqc
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package samtools
seqan-apps
C++ library for the analysis of biological sequences
Versions of package seqan-apps
ReleaseVersionArchitectures
buster2.4.0+dfsg-11amd64,arm64,armhf,i386
sid2.4.0+dfsg-16amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4.0+dfsg-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports2.4.0+dfsg-11~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.4.1+dfsg-2amd64,armhf,i386
experimental2.5.0~rc2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
stretch2.3.1+dfsg-4amd64,arm64,i386,mips64el,ppc64el,s390x
trixie2.4.0+dfsg-16amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.4.0+dfsg-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package seqan-apps:
devellibrary
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SeqAn is a C++ template library of efficient algorithms and data structures for the analysis of sequences with the focus on biological data. This library applies a unique generic design that guarantees high performance, generality, extensibility, and integration with other libraries. SeqAn is easy to use and simplifies the development of new software tools with a minimal loss of performance. This package contains the applications dfi, pair_align, micro_razers, seqan_tcoffee, seqcons, razers and tree_recon.

Please cite: Andreas Doring, David Weese, Tobias Rausch and Knut Reinert: SeqAn An efficient, generic C++ library for sequence analysis. (PubMed,eprint) BMC Bioinformatics 9(1):11 (2008)
Registry entries: Bio.tools  Bioconda 
sibsim4
Richtet exprimierte RNA-Sequenzen an einer DNA-Vorlage aus
Versions of package sibsim4
ReleaseVersionArchitectures
stretch0.20-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.20-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.20-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.20-4amd64,arm64,armhf,i386
jessie0.20-2amd64,armel,armhf,i386
Debtags of package sibsim4:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, searching
works-with-formatplaintext
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Das SIBsim4-Projekt basiert auf sim4, einem Programm, das entwickelt wurde, um eine exprimierte DNA-Sequenz mit einer genomischen Sequenz abzustimmen um Intronen zu erlauben. SIBsim4 ist eine recht umfangreiche Neuerstellung des ursprünglichen Codes mit den folgenden Zielen:

  • Geschwindigkeitsverbesserung;
  • Einsetzbarkeit auf großen (Größenordnung von Chromosomen) DNA-Sequenzen;
  • detailliertere Ausgabe über Spleiß-Typen;
  • detailliertere Ausgabe über Poly(A)-Schwänze;
  • verschiedene Aufräumarbeiten und Verbesserungen des Codes.
Registry entries: Bio.tools 
sigma-align
Einfache multiple Alignments nicht-kodierender DNA-Sequenzen
Versions of package sigma-align
ReleaseVersionArchitectures
trixie1.1.3-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.3-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.1.3-3amd64,armel,armhf,i386
stretch1.1.3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.3-6amd64,arm64,armhf,i386
bullseye1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package sigma-align:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Sigma (»Simple greedy multiple alignment«) ist ein Alignment-Programm. Der Algorithmus und das Scoring-Schema sind speziell für nicht-kodierende DNA-Sequenzen entworfen.

Das Programm verwendet die Strategie des Suchens der bestmöglichen lückenlosen lokalen Alignments. Dies passiert bei jedem Schritt indem ein bestmögliches Alignment passend zu existierenden Alignments ermittelt wird. Sigma bewertet die Signifikanz der Alignments basierend auf den Längen der alignierten Fragmente und eines Hintergrundmodells. Diese können über eine Hilfsdatei intergenischer DNA zur Verfügung gestellt oder geschätzt werden.

Please cite: Siddharthan, Rahul: Sigma: multiple alignment of weakly-conserved non-coding DNA sequence. (PubMed) BMC Bioinformatics 7(1):143 (2006)
Registry entries: Bio.tools 
sim4
Werkzeug für Alignments von cDNA mit genomischer DNA
Versions of package sim4
ReleaseVersionArchitectures
buster0.0.20121010-5amd64,arm64,armhf,i386
jessie0.0.20121010-1amd64,armel,armhf,i386
bullseye0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.0.20121010-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package sim4:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, searching
works-with-formatplaintext
Popcon: 12 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

sim4 ist ein ähnlichkeits-basiertes Werkzeug und erstellt Alignments von exprimierten DNA-Sequenzen (EST, cDNA, mRNA) mit den genomischen Sequenzen des jeweiligen Gens. Das Programm entdeckt und paart Sequenzen, wenn die zwei Eingabesequenzen an einem Ende überlappen (z.B. wenn der Anfang der einen Sequenz mit dem Ende der Anderen überlappt).

sim4 setzt eine auf »Blast« basierende Technik ein, um die passenden Blöcke, die die »exon cores« darstellen, zu ermitteln. In der ersten Phase werden alle möglichen exakten Paare von W-meren (z.B. DNA-Wörter der Länge W) zwischen den zwei Sequenzen ermittelt und diese zu maximalen Gap-freien Segmenten erweitert. In der zweiten Phase werden die »exon cores« zu benachbarten, noch ungepaarten Fragmenten erweitert. Dabei werden auf der Suche nach der besten Übereinstimmung verschiedene »greedy«-Näherungsalgorithmen und Heuristiken genutzt, um Strukturen an die splice-site-Erkennungssignale (GT-AG, CT-AC) anzupassen. Falls notwendig, wird der Prozess mit weniger strengen Parametern für die ungepaarten Fragmente wiederholt.

Please cite: Liliana Florea, George Hartzell, Zheng Zhang, Gerald M. Rubin and Webb Miller: A Computer Program for Aligning a cDNA Sequence with a Genomic DNA Sequence. (PubMed,eprint) Genome Research 8:967-974 (1998)
Registry entries: Bio.tools 
smalt
Sequence Mapping and Alignment Tool
Versions of package smalt
ReleaseVersionArchitectures
buster0.7.6-8amd64,arm64,armhf
jessie0.7.6-4amd64,armhf,i386
bookworm0.7.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.7.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.7.6-6amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

SMALT efficiently aligns DNA sequencing reads with a reference genome. Reads from a wide range of sequencing platforms, for example Illumina, Roche-454, Ion Torrent, PacBio or ABI-Sanger, can be processed including paired reads.

The software employs a perfect hash index of short words (< 20 nucleotides long), sampled at equidistant steps along the genomic reference sequences.

For each read, potentially matching segments in the reference are identified from seed matches in the index and subsequently aligned with the read using a banded Smith-Waterman algorithm.

The best gapped alignments of each read is reported including a score for the reliability of the best mapping. The user can adjust the trade-off between sensitivity and speed by tuning the length and spacing of the hashed words.

A mode for the detection of split (chimeric) reads is provided. Multi-threaded program execution is supported.

Registry entries: Bio.tools  SciCrunch  Bioconda 
snap
location of genes from DNA sequence with hidden markov model
Versions of package snap
ReleaseVersionArchitectures
jessie2013-11-29-1amd64,armel,armhf,i386
stretch2013-11-29-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2013-11-29-9amd64,arm64,armhf,i386
bullseye2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1538 users (94 upd.)*
Versions and Archs
License: DFSG free
Git

SNAP is a general purpose gene finding program suitable for both eukaryotic and prokaryotic genomes. SNAP is an acroynm for Semi-HMM-based Nucleic Acid Parser.

Please cite: Ian Korf: Gene finding in novel Genomes. (PubMed,eprint) BMC Bioinformatics 5:59 (2004)
Registry entries: Bio.tools 
Screenshots of package snap
soapdenovo
short-read assembly method to build de novo draft assembly
Versions of package soapdenovo
ReleaseVersionArchitectures
bullseye1.05-6amd64
bookworm1.05-6amd64
trixie1.05-6amd64
sid1.05-6amd64
jessie1.05-2amd64
buster1.05-5amd64
stretch1.05-3amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo is a novel short-read assembly method that can build a de novo draft assembly for the human-sized genomes. The program is specially designed to assemble Illumina GA short reads.

It creates new opportunities for building reference sequences and carrying out accurate analyses of unexplored genomes in a cost effective way.

This version is not maintained anymore, consider using soapdenovo2.

Please cite: Ruiqiang Li, Hongmei Zhu, Jue Ruan, Wubin Qian, Xiaodong Fang, Zhongbin Shi, Yingrui Li, Shengting Li, Gao Shan, Karsten Kristiansen, Songgang Li, Huanming Yang, Jian Wang and Jun Wang: De novo assembly of human genomes with massively parallel short read sequencing. (PubMed,eprint) Genome Research 20(2):265-72 (2009)
Registry entries: Bio.tools  SciCrunch 
soapdenovo2
Assembler, der Reads zu einem de-novo-Entwurf zusammenfügt
Versions of package soapdenovo2
ReleaseVersionArchitectures
stretch240+dfsg1-2amd64
buster241+dfsg-3amd64
bullseye242+dfsg-1amd64
sid242+dfsg-4amd64
bookworm242+dfsg-3amd64
trixie242+dfsg-4amd64
jessie240+dfsg-2amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo ist eine neuartige Methode zum Zusammenfügen kurzer Reads (Sequenzfragmente), mit der ein de-novo-Entwurf für Genome in der Größenordnung des menschlichen Genoms erstellt werden kann. Das Programm wurde speziell für das Zusammenfügen kurzer Sequenzfragmente von Illumina GA entwickelt.

SOAPdenovo schafft neue Möglichkeiten Referenzsequenzen zu bauen und genaue Analysen von nicht erforschten Genomen in einer kosteneffizienten Weise durchzuführen.

Please cite: Ruibang Luo, Binghang Liu, Yinlong Xie, Zhenyu Li, Weihua Huang, Jianying Yuan, Guangzhu He, Yanxiang Chen, Qi Pan, Yunjie Liu, Jingbo Tang, Gengxiong Wu, Hao Zhang, Yujian Shi, Yong Liu, Chang Yu, Bo Wang, Yao Lu, Changlei Han, David W Cheung, Siu-Ming Yiu, Shaoliang Peng, Zhu Xiaoqian, Guangming Liu, Xiangke Liao, Yingrui Li, Huanming Yang, Jian Wang, Tak-Wah Lam and Jun Wang: SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. Giga Science 1(1):18 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sra-toolkit
utilities for the NCBI Sequence Read Archive
Versions of package sra-toolkit
ReleaseVersionArchitectures
sid3.0.9+dfsg-7amd64,arm64
jessie2.3.5-2+dfsg-1amd64,i386
bullseye2.10.9+dfsg-2amd64
buster2.9.3+dfsg-1amd64
stretch2.8.1-2+dfsg-2amd64,i386
trixie3.0.3+dfsg-9amd64,arm64
bookworm3.0.3+dfsg-6~deb12u1amd64,arm64
upstream3.1.1
Popcon: 11 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Tools for reading the SRA archive, generally by converting individual runs into some commonly used format such as fastq.

The textual dumpers "sra-dump" and "vdb-dump" are provided in this release as an aid in visual inspection. It is likely that their actual output formatting will be changed in the near future to a stricter, more formalized representation[s]. PLEASE DO NOT RELY UPON THE OUTPUT FORMAT SEEN IN THIS RELEASE.

Other tools distributed in this package are:

 abi-dump, abi-load
 align-info
 bam-load
 cache-mgr
 cg-load
 copycat
 fasterq-dump
 fastq-dump, fastq-load
 helicos-load
 illumina-dump, illumina-load
 kar
 kdbmeta
 latf-load
 pacbio-load
 prefetch
 rcexplain
 remote-fuser
 sff-dump, sff-load
 sra-pileup, sra-sort, sra-stat, srapath
 srf-load
 test-sra
 vdb-config, vdb-copy, vdb-decrypt, vdb-encrypt, vdb-get, vdb-lock,
 vdb-passwd, vdb-unlock, vdb-validate

The "help" information will be improved in near future releases, and the tool options will become standardized across the set. More documentation will also be provided documentation on the NCBI web site.

Tool options may change in the next release. Version 1 tool options will remain supported wherever possible in order to preserve operation of any existing scripts.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.tools  Bioconda 
ssake
Genomische Anwendung, die Millionen sehr kurzer DNA-Sequenzen zusammenführt
Versions of package ssake
ReleaseVersionArchitectures
bullseye4.0-3all
trixie4.0.1-2all
buster4.0-2all
bookworm4.0.1-1all
jessie3.8.2-1all
stretch3.8.4-1all
sid4.0.1-2all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Short Sequence Assembly by K-mer search and 3′ read Extension (SSAKE) ist eine genomische Anwendung, die Millionen kurzer Nukleotidsequenzen auf aggressive Weise zusammenführt, indem stufenweise nach den perfekten 3'-endigen k-Meren - unter Verwendung eines DNA-Präfix-Baumes - gesucht wird. SSAKE wurde entwickelt, um die Informationen von Reads aus kurzen Sequenzen wirksam zu nutzen. Dies geschieht, indem diese durchgängig in Contigs angehäuft werden, die zur Charakterisierung von neu zu sequenzierenden Targets verwendet werden.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
staden-io-lib-utils
programs for manipulating DNA sequencing files
Versions of package staden-io-lib-utils
ReleaseVersionArchitectures
buster1.14.11-6amd64,arm64,armhf,i386
bookworm1.14.15-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.14.8-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.13.7-1amd64,armel,armhf,i386
trixie1.15.0-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.14.13-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.15.0-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package staden-io-lib-utils:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 7 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

The io_lib from the Staden package is a library of file reading and writing code to provide a general purpose trace file (and Experiment File) reading interface. It has been compiled and tested on a variety of unix systems, MacOS X and MS Windows.

This package contains the programs that are distributed with the Staden io_lib for manipulating and converting sequencing data files, and in particular files to manipulate short reads generated by second and third generation sequencers and stored in SRF format.

Registry entries: Bioconda 
t-coffee
Multiple Sequence Alignment
Versions of package t-coffee
ReleaseVersionArchitectures
trixie13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye13.41.0.28bdc39+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster12.00.7fb08c2-4amd64,arm64,armhf,i386
stretch11.00.8cbe486-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie11.00.8cbe486-1amd64,armel,armhf,i386
Debtags of package t-coffee:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 11 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

T-Coffee is a multiple sequence alignment package. Given a set of sequences (Proteins or DNA), T-Coffee generates a multiple sequence alignment. Version 2.00 and higher can mix sequences and structures.

T-Coffee allows the combination of a collection of multiple/pairwise, global or local alignments into a single model. It can also estimate the level of consistency of each position within the new alignment with the rest of the alignments. See the pre-print for more information

T-Coffee has a special called M-Coffee that makes it possible to combine the output of many multiple sequence alignment packages. In its published version, it uses MUSCLE, PROBCONS, POA, DiAlign-TS, MAFFT, Clustal W, PCMA and T-Coffee. A special version has been made for Debian, DM-Coffee, that uses only free software by replacing Clustal W by Kalign. Using the 8 Methods of M-Coffee can sometimes be a bit heavy. You can use a subset of your favorite methods if you prefer.

The package is enhanced by the following packages: clustalw dialign-tx kalign mafft muscle muscle3 ncbi-blast+ poa prank probcons tm-align
Please cite: Cédric Notredame, Desmond G. Higgins and Jaap Heringa: T-coffee: a novel method for fast and accurate multiple sequence alignment. (PubMed) Journal of Molecular Biology 302(1):205-217 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tabix
generic indexer for TAB-delimited genome position files
Versions of package tabix
ReleaseVersionArchitectures
jessie0.2.6-2armhf
bookworm1.16+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.1-1amd64,armel,i386
trixie1.20+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
buster1.9-12~deb10u1amd64,arm64,armhf,i386
sid1.20+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental1.21+ds-0+exp2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
upstream1.21
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 26 users (32 upd.)*
Newer upstream!
License: DFSG free
Git

Tabix indexes files where some columns indicate sequence coordinates: name (usually a chromosome), start and stop. The input data file must be position sorted and compressed by bgzip (provided in this package), which has a gzip like interface. After indexing, tabix is able to quickly retrieve data lines by chromosomal coordinates. Fast data retrieval also works over network if an URI is given as a file name.

This package is built from the HTSlib source, and provides the bgzip, htsfile, and tabix tools.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: Bio.tools  Bioconda 
Screenshots of package tabix
theseus
Maximum-Likelihood-Überlagerung von Makromolekülen
Versions of package theseus
ReleaseVersionArchitectures
stretch3.3.0-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster3.3.0-8amd64,arm64,armhf,i386
bullseye3.3.0-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.3.0-14amd64,i386
trixie3.3.0-14amd64,i386
sid3.3.0-14amd64,i386
jessie3.0.0-1amd64,armel,armhf,i386
Debtags of package theseus:
biologypeptidic
fieldbiology, biology:bioinformatics, biology:structural
interfacecommandline
roleprogram
useanalysing, comparing
works-with-formatplaintext
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Das Programm Theseus überlagert gleichzeitig mehrere makromolekulare Strukturen. Theseus findet die optimale Lösung für das Überlagerungsproblems mit der Maximum-Likelihood-Methode. Mit dem »down-weighting« variabler Regionen der Überlagerung und durch einen Ausgleich für Korrelationen zwischen Atomen produziert die ML-Überlagerungsmethode sehr genaue strukturelle Alignments (Ausrichtungen).

Wenn Makromoleküle mit verschiedenen Restsequenzen überlagert werden, verwerfen andere Programme und Algorithmen die mit Lücken ausgerichteten Restsequenzen. Theseus verwendet jedoch einen neuartigen Überlagerungsalgorithmus, der alle Daten verarbeitet.

The package is enhanced by the following packages: theseus-examples
Please cite: Douglas L. Theobald and Deborah S. Wuttke: THESEUS: maximum likelihood superpositioning and analysis of macromolecular structures. (eprint) Bioinformatics 22(17):2171-2172 (2006)
tigr-glimmer
Generkennung in Genomen von Bakterien und Archaebakterien
Versions of package tigr-glimmer
ReleaseVersionArchitectures
bullseye3.02b-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.02-3amd64,armel,armhf,i386
buster3.02b-2amd64,arm64,armhf,i386
stretch3.02b-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.02b-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.02b-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.02b-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package tigr-glimmer:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-with-formatplaintext
Popcon: 10 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Diese Software wurde vom TIGR-Institut entwickelt und spürt kodierende Sequenzen in den Genomen von Bakterien und Archaebakterien auf.

Glimmer ist ein System zum Auffinden von Genen in mikrobieller DNA, speziell den Genomen von Bakterien und Archaebakterien. Glimmer (Gene Locator and Interpolated Markov Modeller) benutzt interpolierte Markov-Modelle (IMMs), um kodierende Regionen zu identifizieren und von nicht-kodierender DNA zu unterscheiden.

Please cite: Steven L. Salzberg, Arthur L. Delcher, S. Kasif and O. White: Microbial gene identification using interpolated Markov models. (PubMed,eprint) Nucleic Acids Research 26(2):544-8 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tree-ppuzzle
Parallelisierte Rekonstruktion phylogenetischer Bäume durch »Maximum Likelihood«
Versions of package tree-ppuzzle
ReleaseVersionArchitectures
buster5.2-11amd64,arm64,armhf,i386
jessie5.2-7amd64,armel,armhf,i386
stretch5.2-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye5.3~rc16+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie5.3~rc16+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid5.3~rc16+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package tree-ppuzzle:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

TREE-PUZZLE (früher PUZZLE) ist ein interaktives Konsolenprogramm, das einen schnellen Suchalgorithmus über einen Baum, sogenanntes »Quartet Puzzling«, implementiert. Es erlaubt die Analyse großer Datenmengen und trifft automatisch Entscheidungen über die Anordnung der jeweiligen Verzweigungen. Weiterhin berechnet TREE-PUZZLE mittels der paarweisen Maximum-Likelihood-Methode Abstände und Längen von Verzweigungen für vom Benutzer definierte Bäume. Die Längen der Verzweigungen können auch unter der »Clock-Assumption« berechnet werden. Außerdem bietet TREE-PUZZLE eine neue Methode, das »Likelihood Mapping«, um die Anordnung einer hypothetischen internen Verzweigung zu untersuchen, ohne den gesamten Baum zu berechnen und um den phylogenetischen Zusammenhang eines Sequenzalignments anzuzeigen.

Dies ist eine parallelisierte Version von tree-puzzle.

Please cite: Heiko A. Schmidt, Korbinian Strimmer, Martin Vingron and Arndt von Haeseler: TREE-PUZZLE: maximum likelihood phylogenetic analysis using quartets and parallel computing. (PubMed,eprint) Bioinformatics 18(3):502-504 (2002)
Registry entries: Bio.tools 
tree-puzzle
Rekonstruktion phylogenetischer Bäume durch »Maximum Likelihood«
Versions of package tree-puzzle
ReleaseVersionArchitectures
sid5.3~rc16+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie5.2-7amd64,armel,armhf,i386
stretch5.2-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster5.2-11amd64,arm64,armhf,i386
bullseye5.3~rc16+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie5.3~rc16+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package tree-puzzle:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 2 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

TREE-PUZZLE (früher PUZZLE) ist ein interaktives Konsolenprogramm, das einen schnellen Suchalgorithmus über einen Baum, sogenanntes »Quartet Puzzling«, implementiert. Es erlaubt die Analyse großer Datenmengen und trifft automatisch Entscheidungen über die Anordnung der jeweiligen Verzweigungen. Weiterhin berechnet TREE-PUZZLE mittels der paarweisen Maximum-Likelihood-Methode Abstände und Längen von Verzweigungen für vom Benutzer definierte Bäume. Die Längen der Verzweigungen können auch unter der »Clock-Assumption« berechnet werden. Außerdem bietet TREE-PUZZLE eine neue Methode, das »Likelihood Mapping«, um die Anordnung einer hypothetischen internen Verzweigung zu untersuchen, ohne den gesamten Baum zu berechnen und um den phylogenetischen Zusammenhang eines Sequenzalignments anzuzeigen.

Please cite: Heiko A. Schmidt, Korbinian Strimmer, Martin Vingron and Arndt von Haeseler: TREE-PUZZLE: maximum likelihood phylogenetic analysis using quartets and parallel computing. (PubMed,eprint) Bioinformatics 18(3):502-504 (2002)
Registry entries: Bio.tools 
vcftools
Collection of tools to work with VCF files
Versions of package vcftools
ReleaseVersionArchitectures
sid0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.1.12+dfsg-1amd64,armel,armhf,i386
jessie-security0.1.12+dfsg-1+deb8u1amd64,armel,armhf,i386
stretch0.1.14+dfsg-4+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.1.16-1amd64,arm64,armhf,i386
bullseye0.1.16-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package vcftools:
roleprogram
Popcon: 18 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools is a program package designed for working with VCF files, such as those generated by the 1000 Genomes Project. The aim of VCFtools is to provide methods for working with VCF files: validating, merging, comparing and calculate some basic population genetic statistics.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet
Assembler für Sequenzen von Nukleinsäuren von sehr kleinen Bruchstücken (»short reads«)
Versions of package velvet
ReleaseVersionArchitectures
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
sid1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.10+dfsg1-5amd64,arm64,armhf,i386
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet ist ein genomischer De-Novo-Assembler, der speziell für Short-Read-Sequenziertechnologien, wie Solexa oder 454, erstellt wurde. Entwickelt wurde der Assembler von Daniel Zerbino und Ewan Birney am European Bioinformatics Institute (EMBL-EBI), nahe Cambridge, im Vereinigten Königreich.

Derzeit liest Velvet Short-Read-Sequenzen ein, entfernt Fehler und erstellt hochqualitative einzigartige Contigs. Danach werden, falls vorhanden, Paired-Read-Informationen verwendet, um die repetitiven Bereiche zwischen Contigs zu erhalten.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
veryfasttree
Speeding up the estimation of phylogenetic trees from sequences
Versions of package veryfasttree
ReleaseVersionArchitectures
sid4.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

VeryFastTree is a highly efficient implementation inspired by the FastTree-2 tool, designed to expedite the inference of approximately-maximum-likelihood phylogenetic trees from nucleotide or protein sequence alignments. It is an optimized implementation designed to accelerate the estimation of phylogenies for large alignments. By leveraging parallelization and vectorization strategies, VeryFastTree significantly improves the performance and scalability of phylogenetic analysis, allowing it to construct phylogenetic trees in a fraction of the time previously required.

Maintaining the integrity of FastTree-2, VeryFastTree retains the same phases, methods, and heuristics used for estimating phylogenetic trees. This ensures that the topological accuracy of the trees produced by VeryFastTree remains equivalent to that of FastTree-2. Moreover, unlike the parallel version of FastTree-2, VeryFastTree guarantees deterministic results, eliminating any potential variations in the output.

To facilitate a seamless transition for users, VeryFastTree adopts the exact same command line arguments as FastTree-2. This means that by simply substituting FastTree-2 with VeryFastTree, and using the same set of options, users can significantly enhance the overall performance of their phylogenetic analyses.

wise
Vergleich biologischer Polymere, wie DNA- und Protein-Sequenzen
Versions of package wise
ReleaseVersionArchitectures
buster2.4.1-21amd64,arm64,armhf,i386
stretch2.4.1-19amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4.1-17amd64,armel,armhf,i386
sid2.4.1-25amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4.1-23amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.4.1-25amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.4.1-23amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package wise:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
Popcon: 15 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Wise2 wurde speziell für den Vergleich biologischer Polymere entwickelt, meist DNA- und Protein-Sequenzen. Es gibt viele andere Programme hierzu, die bekanntesten sind sicherlich das BLAST-Paket (vom NCBI) und Fasta (von Bill Pearson). Weitere sind HMMER (Sean Eddy) oder SAM (UC Santa Cruz), die sich auf Hidden-Markov-Modelle (HMMs) spezialisieren.

Wise2 hat seine besondere Stärke beim Vergleich von DNA-Sequenzen mit daraus hervorgehenden Protein-Sequenzen. Solche Vergleiche gestatten die gleichzeitige Betrachtung etwa von der Genstruktur und dem homologie-basierten Alignment.

Wise2 enthält auch andere Algorithmen, wie etwa den altehrwürdigen Smith-Waterman-Algorithmus, oder modernere wie Stephen Altschuls generalisierte gap penalties, oder sogar experimentelle, wie den selbst entwickelten dba. Die Entwicklung dieser Algorithmen wird durch die Einfachheit der Algorithmenentwicklung in der von Wise2 genutzten Umgebung ermöglicht.

Wise2 wurde auch in Hinblick auf Wiederverwendbarkeit und Programminstandhaltung entwickelt. Obwohl es ausschließlich in C geschrieben wurde, kann seine Funktionalität durch Perl angesprochen werden. Teile des Pakets (oder das gesamte Paket) können durch andere C- oder C++-Programme genutzt werden ohne Konflikte mit den Namensgebungen der Variablen, denn alle externen Variablen haben »Wise2« als Präfix.

Please cite: Ewan Birney, Michele Clamp and Richard Durbin: GeneWise and Genomewise. (PubMed,eprint) Genome Research 14(5):988-95 (2004)
Registry entries: Bio.tools  Bioconda 

Debian packages in contrib or non-free

cufflinks
Transcript assembly, differential expression and regulation for RNA-Seq
Versions of package cufflinks
ReleaseVersionArchitectures
trixie2.2.1+dfsg.1-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.1-3 (non-free)amd64
jessie2.2.1-1 (non-free)amd64
buster2.2.1+dfsg.1-3 (non-free)amd64,arm64,armhf,i386
bullseye2.2.1+dfsg.1-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.1+dfsg.1-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

Cufflinks assembles transcripts, estimates their abundances, and tests for differential expression and regulation in RNA-Seq samples. It accepts aligned RNA-Seq reads and assembles the alignments into a parsimonious set of transcripts. Cufflinks then estimates the relative abundances of these transcripts based on how many reads support each one.

This package provides the binary of cufflinks and associated tools, i.e. compress_gtf, cuffcompare, cuffdiff, cuffmerge, cuffnorm, cuffquant and gtf_to_sam.

Please cite: Cole Trapnell, Brian A Williams, Geo Pertea, Ali Mortazavi, Gordon Kwan, Marijke J van Baren, Steven L Salzberg, Barbara J Wold and Lior Pachter: Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. (PubMed) Nature Biotechnology 28(5):511-515 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
embassy-phylip
EMBOSS conversions of the programs in the phylip package
Versions of package embassy-phylip
ReleaseVersionArchitectures
jessie3.69.650-2 (non-free)amd64
stretch3.69.660-1 (non-free)amd64
buster3.69.660-3 (non-free)amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: non-free
Git

This package is the adaptation of the PHYLIP package in which its programs can operate with the biological sequence formats and databases of the European Molecular Biology Open Software Suite (EMBOSS). The software packages adapted for EMBOSS are called EMBASSY.

PHYLIP (the PHYLogeny Inference Package) is a package of programs for inferring phylogenies (evolutionary trees). Methods that are available in the package include parsimony, distance matrix, and likelihood methods, including bootstrapping and consensus trees. Data types that can be handled include molecular sequences, gene frequencies, restriction sites and fragments, distance matrices, and discrete characters.

The EMBASSY PHYLIP programs all have the prefix "f" to distinguish them from the original programs and avoid namespace conflict.

Packaging has started and developers might try the packaging code in VCS

bagpipe
genomewide LD mapping
Versions of package bagpipe
ReleaseVersionArchitectures
VCS2012.02.15-1all
Versions and Archs
License: GPL3+
Debian package not available
Git
Version: 2012.02.15-1

Bagpipe is a program for performing genomewide linkage disequilibrium mapping of quantitative trait loci in populations whose genome structure can be accommodated in the HAPPY framework [Mott00]. This includes most diploid crosses where the founders of the individuals have known genotypes.

  • Bagpipe is a simplified and streamlined version of Bagphenotype that does not currently include resample model averaging (RMA) capabilities.
  • Bagpipe can help fit single locus regression models (with or without random effects) to marker intervals whose genetic ancestry is inferred using the HAPPY software.
  • Bagpipe cannot help you decide what is a sensible model to fit.
  • Bagpipe does not currently accommodate populations with significant population structure, except through the specification of simple random intercepts based on unpatterned covariance matrices.
  • Bagpipe is named after the Scottish wind instrument "the bagpipes" and after Bagphenotype, which in turn was a PIPEline for BAGging-based multiple QTL analysis of phenoTYPEs. Bagphenotype was in turn based on software written by Richard Mott and William Valdar to analyze heterogeneous stock mice in [Valdar06].
  • Bagpipe is experimental software, is provided free of charge subject to copyleft restrictions, and comes with no guarantees whatsoever.
Please cite: Richard Mott, Christopher J. Talbot, Maria G. Turri, Allan C. Collins and Jonathan Flint: A method for fine mapping quantitative trait loci in outbred animal stocks. (PubMed) Proc Natl Acad Sci U S A. 97(23):12649-54 (200)
*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 248469