In der Molekularbiologie spielen Zeichenketten (Strings) eine bedeutende Rolle. So lässt sich zum Beispiel das Genom eines jeden Lebenwesens durch einen String über dem Alphabet {A,C,G,T} darstellen. Je nach Spezies hat ein Genom eine Länge von mehreren Millionen oder sogar Milliarden Zeichen. Solche Genome sind für den Menschen zunächst sehr schlecht zu lesen bzw. zu verstehen. Daher entwickeln wir Algorithmen, um in solchen Sequenzen oft wiederkehrende Muster, sogenannte Motive, aufzuspüren. Dies wird dadurch erschwert, dass solche Motive in der Regel nicht exakt wiederkehren, sondern in verschiedenen Varianten auftreten. Die Suche nach Motiven ist also trotz moderner Algorithmen ein sehr rechenintensiver Prozess. Daher möchten wir im Rahmen einer Diplomarbeit die Rechenkapazität von GPUs (graphics processing unit) heutiger Grafikkarten für die Motivsuche nutzbar machen. Wir suchen daher eine Diplomandin oder einen Diplomanden, die/der Interesse an der Kombination von String-Algorithmen und Sequenzanalyse und hardwarenahem Programmieren hat. Eine wichtige Voraussetzung sind solide Programmierkenntnisse in C/C++. Kontakt: Johannes Köster, Prof. Sven Rahmann (Ls 11) |
