Vor- und Nachteile der beiden Systemarchitekturen
Die reinen Capture-Lösungen sind in der Regel die kostengünstigeren Varianten in Bezug auf die Rechnungseingangsbearbeitung. Zum ERP-System wird lediglich eine Schnittstelle zur Übergabe der Rechnungsdaten benötigt. Anpassungen innerhalb des ERP-Systems fallen praktisch nicht an. Sofern im Rahmen des Capture-Prozesses nicht alle relevanten Daten korrekt ermittelt werden konnten, muss die Rechnung jedoch auch im ERP-System nochmals „angefasst“ werden. Der gesamte Verarbeitungsprozess ist auf zwei Systeme aufgeteilt, die beide separat gepflegt werden müssen.
Die integrierte Variante bietet den Vorteil, dass das ERP-System den gesamten Verarbeitungsprozess überwacht und innerhalb des ERP-Systems jederzeit der aktuelle Status zu den einzelnen Rechnungen verfolgt werden kann. Hierfür sind allerdings auch mehrere Schnittstellen durch das ERP-System neu zu bedienen, da Systemkomponenten wie ein OCR-Server, ein Validierungs-Client (zur manuellen Eingabe nicht erkannter bzw. Korrektur fehlerhafter Erkennungsergebnisse) oder Web-Applikation-Server (zur Steuerung des Freigabe/Kontierungs-Prozesses) für die Verarbeitung jeder Rechnung vom ERP-System aufgerufen und mit Daten versorgt werden müssen.
Verfahren zur Datenextraktion
Rechnungen gehören im OCR-Sprachgebrauch zu den sogenannten „semistrukturierten“ Dokumenten, d.h. Rechnungen von verschiedenen Kreditoren besitzen unterschiedliche Layouts, und die Informationen auf der Rechnung stehen an unterschiedlichen Positionen; aber von jeder Rechnung werden dieselben Daten für die weitere Bearbeitung und Verbuchung benötigt. Das System muss also immer nach den gleichen Informationen ermitteln, diese jedoch frei auf dem Dokumentimage suchen. Daher gestaltet sich die automatische Erkennung bei Rechnungen deutlich komplizierter als bei Formularen mit festem Layout.
Die Erkennungsprozess (OCR und Daten-Abgleich) liefert in der Regel durchschnittlich 70-90% der für die weitere Zuordnung und Verbuchung benötigten Daten einer Rechnung. Da bei einer Rechnung zumindest acht bis zehn Kopfdatenfelder, wie z.B. Rechnungsnummer, Rechnungsdatum, Steuersatz, Netto-, Steuer- und Bruttobetrag, erkannt werden müssen und zudem noch weitere Informationen von der Rechnung ermittelt werden (z.B. Prüfung der Pflichtangaben nach §14 UStG) ergibt sich bei einem großen Teil der Rechnungen ein manueller Nachbearbeitungsaufwand.
Die genannten 70 – 90% gelten hierbei für Rechnungen aus dem EU-Raum. Bei Rechnungen aus anderen Ländern oder in anderen Sprachen können die Erkennungsraten z.T. deutlich geringer sein.
Auch bei den OCR-Verfahren verfolgen die Hersteller unterschiedliche Ansätze.
- Template-Verfahren: Jedes zu bearbeitende Rechnungs-Layout wird einzeln „antrainiert“.
- Regelbasierte Verfahren: Für die Erkennung der Rechnungsinhalte wird ein Regelwerk mitgeliefert, das bei allen zu verarbeitenden Rechnungen angewendet wird.
- Selbstlernende Verfahren: Das System „merkt“ sich manuelle Korrekturen oder Ergänzungen von Rechnungsdaten und wendet diese Informationen zukünftig an.
Die verschiedenen Verfahren können auch kombiniert eingesetzt werden. Sofern nicht nur ein sondern mehrere OCR-Verfahren bzw. -Programme in einem System Anwendung finden, werden die jeweiligen Einzelergebnisse nach vorgegebenen Regeln bewertet und zu einem Gesamtergebnis zusammengeführt („Voting“-Verfahren).
Die angewendeten Methoden zur Erkennung der Rechnungsdaten sind dabei vielfältig.
Zur Ermittlung eines Rechnungs-Templates werden u.a. folgende Verfahren angewendet:
- Grafische Verfahren orientieren sich am „Aussehen“ der Dokumente. Hier spielen die Struktur der Dokumente sowie grafische Elemente (Logos, etc.) eine wichtige Rolle.
- Inhaltsbasierte Varianten orientieren sich an einzelnen „Signalworten“ wie „Rechnung“, „Bestellung“ sowie den zugehörigen, notwendigen Inhalten.
- Statistische Verfahren werten den sog. Volltext (den gesamten erkannten Rechnungsinhalt) aus und Werten Phrasen und die Anzahl spezieller Wörter bzw. Wortgruppen aus.
Für die Ermittlung der Rechnungsdaten werden ebenfalls verschiedene Methoden angewendet:
- Suche nach Feldtypen: Für strukturierte Datenfelder wie Datums- oder Betragsangaben werden entsprechende Zeichenmuster vordefiniert.
- Suche nach regulären Ausdrücken (z.B. 8 – 10 stellige Bestellummer mit den ersten beiden Ziffern „45“ oder „55“).
- Schlüsselwort-Suche: Das gesuchte Feld muss in geografischer Nähe zu einem Schlüsselwort stehen.
- Datenabgleich: Erkannte Rechnungsdaten werden gegen Bestandsdaten aus dem Buchungssystem abgeglichen (z.B. Ermittlung der Kreditorennummer durch Abgleich mehrerer Daten wie Bankverbindung, Steuernummer, Telefonnummer oder Adressangaben)
Verarbeitung von Rechnungen mit und ohne Bestellbezug
Der Verarbeitungsprozess für Rechnungen mit und ohne Bestellbezug unterscheidet sich in wesentlichen Punkten. Rechnungen ohne Bestellbezug durchlaufen in der Regel immer einen Workflow bei dem Kontierungsinformationen (z.B. Kostenstelle oder Sachkonto) und eine Genehmigung der Rechnung von den zuständigen Mitarbeitern eingeholt werden. Erst nach Vorlage dieser Informationen kann die Rechnung gebucht werden.
Bei Rechnungen mit Bestellbezug ermöglichen Rechnungseingangsbearbeitungssysteme den automatischen Abgleich der erkannten Rechnungsdaten mit den ERP-Daten (Abgleich gegen Bestelldaten oder gebuchten Wareneingang). Bei einem erfolgreichen Abgleich kann eine automatische Verbuchung erfolgen. Eine Freigabe von Rechnungen mit Bestellbezug ist in der Regel nur bei ermittelten Preis- oder Mengenabweichungen notwendig.
Für die Durchführung der Genehmigungs-Umläufe nutzen Rechnungseingangsbearbeitungssysteme häufig das Mail-System oder andere unternehmensweit verbreitete Postkorb-Systeme. Dies ermöglicht es, alle Mitarbeiter im Unternehmen bei Bedarf anzusprechen.