Bitte wählen Sie ihr Lieferland und ihre Kundengruppe
Es werden neue Anwendungen der Kommunikations- und Informationstheorie auf Probleme in der molekularen Biologie behandelt. Im ersten Teil wird Quellencodierung genutzt um die Speicheranforderungen von genomweiten Sequenzalignment Datensätzen zu verringern. Ein hocheffizienter Kompressionsalgorithmus basierend auf statistischen Modellen der Evolution und Techniken aus der binären Bildcodierung wird vorgeschlagen. Im zweiten Teil werden Parallelen zwischen der Marker Synchronisation über verrauschte Kanäle und der Protein-DNA Bindungsstellensuche studiert. Statistische Bindungsstellen Modelle und Inferenztechniken werden aus informationstheoretischer Sicht analysiert und erweitert. Synchronisationseigenschaften von ausgewählten molekularen Markern werden evaluiert und Evidenz für Selektionsdruck zugunsten effizienter Marker gefunden.
This thesis covers novel applications of concepts from communications engineering to problems in molecular biology. In the first part the focus is placed on applying source coding techniques to reduce the storage requirement of multiple genome alignment datasets used in comparative genomics. A highly efficient lossless compression algorithm using well established models of genome evolution and binary image compression techniques is introduced. The second part studies parallels between sequence specific protein binding on the molecular level and marker synchronization. The engineering concept of threshold based marker synchronization over noisy channels is revised and extended. Binding site models and in silico inference techniques are reviewed using information theory. Synchronization properties of selected molecular markers are analysed and evidence for natural selection pressure towards good markers is found.