posted Oct 4, 2012, 2:39 AM by Corinna Ernst
The Genome Informatics Group contributed two talks and three posters to this year's German Conference on Bioinformatics in Jena. Johannes presented "Building and Documenting Bioinformatics Workflows with Python-based Snakemake" and Marianna spoke about "Designing q-unique DNA sequences with integer linear programs and Euler tours in de Bruijn graphs". Slides of Johannes' talk can be found here. Dominik presented his poster "An Automation-Based View on Error-Tolerant Pattern Matching with Backward Search" providing a new perspective on classical Backward Search. Corinna's poster “An Efficient Data Structure for Pangenomes” shows how to represent the differences and commonalities among the genomic sequences of related species in a memory-efficient and meaningful way. Marcel's poster “Alignment of flowgrams to strings” describes his work on automatic error-correction for DNA sequencing technologies that use so-called “flowgrams” as an intermediate representation of DNA. Corinna and Marcel share 2nd Place of Best Poster Award for their posters presented. |
posted Oct 22, 2011, 2:42 PM by Sven Rahmann
[
updated Oct 25, 2011, 1:49 PM
]
posted Sep 8, 2010, 12:47 PM by Sven Rahmann
Today, Sven presented an invited talk at JOBIM 2010 in Montpellier about future challenges of next generation sequencing. I put emphasis on the following key points. - I agree with David Haussler's HiTSeq talk that it would be interesting not to receive only DNA reads and qualities from the sequencers, but richer information, which we may call "sequences of internal machine state". In a technology-dependent process, they could always be converted to DNA+qualities, but may be more helpful for further analysis.
- I would like to have a lightweight, fast, memory-efficient indexing method that allows to retrieve 1-difference matches of q-grams efficiently. I assume that new ideas in hashing may help here.
- In the past, speed has be more important for read mappers than accuracy. I believe that there is a need for mappers that give stronger guarantees. For example: output not only the best match (or one random best match), but all matches with a certain (quality-weighted) error rate, and then do something which I like to call "probabilistic" mapping, if the location of a read in the reference cannot be determined uniquely.
- With terabytes of sequencing data becoming available, we need to think about large-scale phylogeny algorithms and visual tools for explorative analysis of large multiple alignments.
- In the long run, we will want to develop genrative probabilistic models for pan-genomes (similar to, but richer than HMMs for protein families).
This summarizes it pretty much. I was awfully tired, because the night before, my flight could not land at Montpellier airport due to bad weather, and so we were re-routed to Marseille, where Air France eventually organized a bus to drive us to Montpellier in the middle of the night. It might have been a nice trait to offer an option to drop us off in the city (who wants to stay at the airport anyway), but no luck. It took another 30+ minutes until a few taxis arrived. By the time I got to my hotel, they had shut down for the night, without an emergency phone number or a night porter available. Fortunately, it was a warm night, so Montpellier is not so bad for homeless people. In summary, quite an unpleasant experience, and Air France could at least have offered or paid for dinner (as they are obliged to by EU regulations, anyway). |
posted Sep 1, 2010, 7:58 AM by Sven Rahmann
Die Arbeitsgruppe entwickelt zur Zeit online-Algorithmen für die Analyse von Ionenmobilitätsspektren in Zusammenarbeit mit der Firma B&S Analytik und dem KIST Europe (PD Dr. Jörg Ingo Baumbach). Diese Algorithmen werden es ermöglichen, relevante Informationen (Peaks) aus den Spektren zu erhalten, auch ohne die gesamten Messdaten zunächst zu speichern (zur Zeit ca. 280 MB bei einer hochauflösenden Messung). Dies ist insbesondere für zukünftige miniaturisierte mobile IMS-Geräte attraktiv, die mit ihrer Energie haushalten müssen; sie benötigen dann weniger energieintensiven Speicher. Mehr Informationen. |
posted Jul 23, 2010, 10:13 AM by Sven Rahmann
Dr. Eric Rivals, Forschungsdirektor am renommierten Centre national de la recherche scientifique (CNRS),
arbeitete vom 28.06 bis 23.07.2010 auf Einladung der Rektorin der TU Dortmund als
Gambrinus Fellow in der Arbeitsgruppe "Bioinformatics for High Throughput Technologies" am Lehrstuhl Informatik XI unserer Fakultät.
Ermöglicht wird dieser Gastaufenthalt durch die Stiftung Dortmunder
Gambrinus Fellowships, die durch die Sozietät Rechtsanwälte Niebaum
gefördert wird.
Dr. Rivals hat im Jahre 1996 an der Universität in Lille promoviert
und an der Universität von Montpellier II in 2005 habilitiert. Seine
Forschungsarbeiten, die er in Montpellier durchführt, reichen von der
Bioinformatik (Computational Biology) über einschlägige Fragestellungen
aus den Bereichen Algorithmik, Kombinatorik und Statistik bis hin zu
Aspekte der Genomik und Evolutionsbiologie. Mit seinen Forschungen will
Dr. Rivals einen Beitrag leisten zu einer personalisierten Medizin, die
es folglich erlaubt, präziser zu diagnostizieren und weitaus gezielter
wirkende Medikamente zur Verfügung zu stellen.
Im Rahmen seines Aufenthaltes arbeitet er eng mit Prof. Dr. Sven Rahmann zusammen, der die Arbeitsgruppe Bioinformatik für Hochdurchsatztechnologien leitet. Insbesondere auf dem Gebiet der genomweiten SNP-Analyse von Hochdurchsatz-Sequenzierdaten wird eine Kooperation verfolgt.
Die eingeladenen Gambrinus Fellows
nehmen Aufgaben in Lehre und Forschung wahr. Darüber hinaus halten sie
mindestens einen hochschul-öffentlichen Vortrag. Der Titel des Vortrags lautet: Bioinformatics: Linking Genomics to Personalized Medicine. Zeit und Ort: Donnerstag, den 15.7.2010, 17.30 h, im Internationalen
Begegnungszentrum (IBZ) der TU Dortmund, Emil-Figge-Str. 59.
Link: Dr. Rivals's Homepage;)
|
posted Mar 8, 2010, 7:25 AM by Sven Rahmann
posted Feb 1, 2010, 1:50 PM by Sven Rahmann
[
updated Feb 1, 2010, 1:58 PM
]
Unser Artikel "Exact Analysis of Horspool’s and Sunday’s Pattern Matching Algorithms with Probabilistic Arithmetic Automata" wird von uns auf der LATA 2010 in Trier vorgestellt. Er enthält neue Ideen zur exakten Analyse der Laufzeit (Textzugriffe) der klassischen Pattern-Matching-Algorithmen des Boyer-Moore-Typs von Horspool und Sunday. Ab sofort ist auch die Software "Horspool-Analyser" dazu verfügbar. |
posted Oct 16, 2009, 6:00 AM by Sven Rahmann
Die Bioinformatik wird auf dem Schülertag, den die Fakultät für Informatik der TU Dortmund am 18.11.2009 veranstaltet, mit einem Workshop zum Sequenzvergleich vertreten sein. Viele Gene des Menschen und der Maus sind nahezu identisch oder sehr ähnlich. Wie kann man in zwei (sehr langen) DNA-Sequenzen die Unterschiede so darstellen, dass man sie auf den ersten Blick erkennt? Umgekehrt, wie kann man in auf den ersten Blick sehr verschiedenen DNA- oder Proteinsequenzen noch gemeinsame Abschnitte entdecken, die möglicherweise auf einen gemeinsamen Ursprung hindeuten? Wir werden gemeinsam Methoden zum Sequenzvergleich erarbeiten und Beispiele betrachten. Es wird schnell deutlich werden, dass man diese Arbeit nicht manuell erledigen, sondern einem Computer überlassen möchte. |
posted Aug 17, 2009, 4:58 AM by Sven Rahmann
[
updated Aug 17, 2009, 5:02 AM
]
Seinen diesjährigen "Betriebsausflug" gestaltete der Lehrstuhl 11 am 11.08.2009 als gemeinsame Radtour durch das Dortmunder Umland nach Unna und an der S4-Bahnlinie zurück. Teile des Streckenverlaufs wurden mit einem GPS-Tracker aufgezeichnet und können mit Google Maps angeschaut werden. |
posted Aug 13, 2009, 2:34 PM by Sven Rahmann
[
updated Aug 13, 2009, 2:46 PM
]
Die Bioinformatik stellte sich auf der SchnupperUni 2009 mit einem Vortrag und einer Übung zur Massenspektrometrie vor: Dabei ging es um die exakte Zerlegung einer gegebenen Gesamtmasse in gegebene Teilmassen, z.B. Atommassen. Solche Methoden sind in der Massenspektrometrie von großer Bedeutung,
aber das mathematisch identische Problem entsteht auch, wenn man wissen
möchte, auf wie viele Arten und Weisen man 263 Hähnchennuggets
bestellen kann, wenn es Packungen der Größe 6, 9 und 20 gibt. Algorithmisch findet hierbei das Prinzip der Dynamischen Programmierung (DP) Anwendung. Python-Code zur Massenzerlegung ist auf dieser Seite als Anhang vorhanden. Bei Fragen wenden Sie sich bitte an Prof. Sven Rahmann |
|