Automatische Klassifizierung von deutschsprachigen elektronischen Katalogen der Elektroindustrie nach dem Elektrotechnischen Informationsmodell (ETIM)
(Deutsch)
Bitte wählen Sie ihr Lieferland und ihre Kundengruppe
In dieser Arbeit wurde eine Konzeption eines Systems für die automatische Klassifizierung nach dem Elektrotechnische Informationsmodell (ETIM) erstellt. Das ETIM ist ein Klassifikationssystem, das sich am besten für die Klassifizierung von elektronischen Produktkatalogen der Elektroindustrie eignet. Da bei großen Katalogen die konventionelle, computerunterstützte Klassifizierung nach ETIM zu zeitaufwendig und zu teuer werden kann, ist es sinnvoll, automatische Klassifizierungsverfahren zu verwenden. Das System unterstützt ferner die automatische Induktion von Klassifizierungs- und Extraktionsregeln. Auch die manuelle Erstellung der Regeln ist möglich. Für die Merkmalsextraktion können Boolesche und reguläre Extraktionsregeln verwendet werden. Boolesche Extraktionsregeln können die Extraktion von logischen und alphanumerischen Merkmalen auch dann ermöglichen, wenn tatsächliche Wertangaben in einem Artikel fehlen. Für die Konzeption wurde eine modellhafte Implementierung durchgeführt. Die Klassifizierungsverfahren wurden nach der Holdout-Methode getestet. Zum Unterschied von manuell erstellten Klassifizierungsregeln drücken Regeln, die automatisch aus Katalogen erzeugt werden, kein Expertenwissen im Bereich Elektrotechnik aus, sondern bilden Lexika von separaten Lieferanten an das Klassifikationssystem ab. Deswegen sind die aktuell implementierten Funktionen insbesondere für das Training und die Klassifikation der Produkte von seitens der Lieferanten geeignet. Das Testen der Merkmalsextraktion ist derzeit nur für separate Merkmale möglich, kann aber in der Zukunft für Merkmalsmengen angepasst werden. Die Ergebnisse der Implementierung zeigen, dass das konzipierte System für automatische Klassifizierung realisierbar ist. Voraussichtlich können die implementierten Funktionen nach einigen Erweiterungen und Anpassungen auch für betriebliche Zwecke verwendet werden.
Automatische Klassifizierung von deutschsprachigen elektronischen Katalogen der Elektroindustrie nach dem Elektrotechnischen Informationsmodell (ETIM)
Weitere Titelangaben:
Automatic classification of German speaking, electronical catalogues for the electrotechnical industry applying the electrotechnical information model (ETIM)