Enzyme sind hochspezialisierte Proteine, deren vielfältige Funktionen einen immer häufigeren Einsatz in industriellen Anwendungen erlauben. Enzymbasierte Prozesse sind wegen den milden Reaktionsbedingungen, unter denen sie stattfinden, meistens deutlich umweltschonender als vergleichbare chemische Methoden. Das Potential von Enzymen für biotechnologische Anwendungen ist demnach groß. Trotzdem werden sie bislang verhältnismäßig selten industriell eingesetzt. Gründe hierfür sind die häufig geringe katalytische Aktivität, ungenügende Substratspezifität für nicht-natürliche Substrate sowie Stereoselektivität oder eine unzureichende Stabilität unter den benötigten Prozessbedingungen. Zwei Strategie werden weitläufig benutzt, um diese Limitationen zu umgehen: i) die Suche nach neuen Enzymen mit besseren Eigenschaften oder ii) die Verbesserung bekannter Biokatalysatoren durch protein engineering. Für beide Ansätze ist ein umfassendes Verständnis der Sequenz-Struktur-Funktions-Beziehung nötig, welches mit Hilfe von familienspezifischen Proteindatenbanken generiert werden kann. Ziel dieser Doktorarbeit war es, den Nutzen solcher Datenbanken für biotechnologische Anwendungen zu demonstrieren. Hierfür wurden exemplarisch die drei biotechnologisch interessanten Proteinfamilien der Triterpen-Zyklasen (TTC), der Imin-Reduktasen (IRED) und der Multikupfer-Oxidasen (MCO) gewählt. Die TTCs katalysieren die Polyzyklisierung linearer Terpene, wodurch sie großes Potential für die Herstellung von Duft- und Geschmacksstoffen, Bakteriziden, Fungiziden sowie Pharmazeutika aufweisen. IREDs hingegen zeichnen sich durch die hohe Stereoselektivität und katalytische Aktivität bei der Reduktion von Iminen zu chiralen Aminen aus, was sie besonders interessant für die Produktion verschiedener pharmazeutischer Stoffe, Agrochemikalien und weiterer Spezialchemikalien macht. Ebenfalls biotechnologisch interessant sind MCOs, welche die Oxidation vielfältiger Substrate bei gleichzeitiger Reduktion von molekularem Sauerstoff katalysieren. Im Rahmen dieser Arbeit wurden familienspezifische Proteindatenbanken für diese Familien entwickelt, welche als Basis für die Auswahl neuer Enzyme und für die Identifikation von strukturell und funktionell wichtigen Positionen, mit dem Ziel Biokatalysatoren zu optimieren, dienen. Die in der Triterpene Cyclase Engineering Database (www.TTCED.BioCatNet.de) enthaltenen Sequenzen wurden auf konservierte Positionen hin untersucht. Die Ergebnisse dieser Analyse wurden mit Informationen aus allen bislang untersuchten TTC-Mutanten kombiniert, wodurch schematische Modelle der Squalen-Hopen- und der Oxidosqualen-Zyklase Bindetaschen entworfen werden können. Diese können als Werkzeug zur Vorhersage der Produktspezifität von TTC-Varianten genutzt werden und unterstützen somit weiteres protein engineering. Des Weiteren konnten die Ergebnisse der Konservierungsanalyse genutzt werden, um die Grundlage der in der β-Domäne der TTCs beobachteten Symmetrie zu erklären. Die Imine Reductase Engineering Database (www.IRED.BioCatNet.de) wurde entwickelt um als Werkzeug zur Vorhersage der Stereoselektivität von IREDs und zur Navigation innerhalb der Proteinfamilie zu dienen. Die Vorhersage wurde durch die Auswahl von drei neuen IREDs überprüft, wodurch die Anzahl der bis zu dem Zeitpunkt biochemisch charakterisierten IREDs verdoppelt werden konnte. Um die molekulare Grundlage der Stereoselektivität in diesen Enzymen besser zu verstehen, wurden superfamilienspezifische Konservierungen untersucht. Dadurch konnten zwei Positionen identifiziert wurden, welche sich in allen bislang bekannten R- und S-selektiven IREDs unterscheiden. Durch den Vergleich mit den verwandten β-Hydroxysäure-Dehydrogenasen konnten zudem die Unterschiede in der Substratspezifität erklärt und IRED-spezifische Sequenzmotive, für die cofaktorbindende und katalytische Region, entworfen werden. Diese Sequenzmotive können genutzt werden, um putative IREDs zu identifizieren, wodurch über 1.400 Sequenzen in die Imine Reductase Engineering Database aufgenommen werden konnten. Die bereits zuvor entstandene Laccase and Multicopper Oxidase Engineering Database (www.LccED.BioCatNet.de) wurde im Rahmen dieser Arbeit um MCOs mit zwei und sechs Domänen erweitert. Um trotz großer Vielfalt und der sich unterscheidenden Anzahl an Domänen eine systematische Analyse dieser Proteinfamilie zu ermöglichen, wurde eine domänenbasierte Standardnummerierung für MCOs entwickelt. Dadurch konnten die verschiedenen Domänen eindeutig innerhalb der Sequenzen identifiziert und verglichen werden. Um den modularen Aufbau der MCOs besser zu verstehen, wurden schematische Modelle der Domänenanordnung entworfen. Des Weiteren wurden die substratbindenden loops untersucht, was die Grundlage für weitere Untersuchungen der Substratspezifität dieser interessanten Enzymfamilie bildet.