CIB deepER 2.7.0 – Texterkennung jetzt auch auf Spanisch

Haben Sie schon mal versucht, Texte in einer Präsentation oder einem Text zu durchsuchen? Manuell ist es ziemlich mühselig. Aber unsere OCR-Lösung CIB deepER ist darauf spezialisiert!

Aber zunächst einmal, wofür steht eigentlich OCR? Optical Character Recognition – oder ins Deutsche übersetzt – optische Zeichenerkennung. CIB DeepER ermöglicht Texterkennung aus Scans und Fotos. Der Text wird von künstlicher Intelligenz extrahiert und mit Hilfe unseres Viewers CIB doXiview erkannt.

Mit dem neuen Release 2.7.0 ist die Texterkennung neben Deutsch und Englisch jetzt auch auf Spanisch möglich!

CIB DeepER wurde als gemeinsames Projekt mit dem Fraunhofer Institut geboren und vom Bundesministerium für Forschung und Innovation (BMFI) finanziell gefördert. Damit war CIB einer der Vorreiter in der Entwicklung von einem OCR-System auf Basis von künstlicher Intelligenz. Eine Technologie, die gute Anwendung in der Digitalisierung findet, insbesondere in den Bereichen Buchhaltung und Archivierung.

OCR in der Buchhaltung

In der Buchhaltung erweist sich die Anwendung von Texterkennungssoftware wie CIB DeepER als besonders effektiv:

  1. Eingegangene Papierrechnungen werden eingescannt.
  2. Die OCR-Technologie wandelt die grafischen Daten in maschinenlesbare Informationen um.
  3. Die Abrechnungssoftware erzeugt eine digitale Kopie der Rechnung und stellt sie zur weiteren Bearbeitung zur Verfügung.

Die Vorteile sind klar:

  • Die involvierten Mitarbeiter bekommen schnellen Zugriff auf die Daten.
  • Die manuelle Dateneingabe entfällt und Fehler werden dadurch vermieden.
  • Der Arbeitsprozess wird verbessert und die Produktivität gesteigert.

OCR in der Archivierung

Papierunterlagen manuell zu indexieren ist extrem mühsam:

  1. Man muss sie einscannen.
  2. Der vollständige Text muss ausgewertet werden.
  3. Relevante Stichworte müssen zugewiesen werden.
  4. Das Dokument muss korrekt in der Archivstruktur abgelegt werden.

Eine automatische Texterkennung, wie es mit CIB DeepER möglich ist, bietet einige Vorteile:

  • Die Suche nach relevanten Stichworten passiert automatisch.
  • Mit Hilfe von künstlicher Intelligenz wird die Texterkennung kontinuierlich verbessert.
  • Die Technologie kann in Ihr bestehendes Archiv eingebaut werden, oder Sie können sie in Verbindung mit einer unserer Dokumentenablagelösungen wie CIB doXigate, CIB doXisafe oder CIB doXima verwenden.

Möchten Sie mehr über CIB DeepER erfahren? Klicken Sie hier.

Haben Sie Fragen? Sie erreichen uns unter +49 89 143 60 – 300 oder per E-Mail an info@cib.de.

Teile diesen Post:

Auf Schatzsuche mit dem Handschriftenerkennungstool Transkribus

Jahrhunderte alte Schriften mühelos entziffern und dabei auf literarische Schätze wie beispielsweise bisher unbekannte Notizen und Zeichnungen von van Gogh stoßen. Eine Phantasie, die für viele Bibliothekare und Historiker dank Transkribus endlich wahr wird.

Doch was ist Transkribus eigentlich?

Handschriftenerkennung, Layout Analyse und Strukturerkennung sind hier die Schlagworte. Transkribus ist ein Programm, das auf die Erkennung von historischen Handschriften spezialisiert und für jeden frei zugänglich ist. Es ist Teil der europäischen Genossenschaft READ-COOP SCE und wurde bei der Entwicklung des Tools staatlich unterstützt.

Bei der zweitägigen Transkribus User Conference in Innsbruck lernten wir alles über die richtige Anwendung, zukünftige Funktionen und erfolgreiche Projekte der Plattform Transkribus. Selbst mit fehlender Expertise im Bereich OCR – oder generell im Bereich Informatik – war es spannend und gut verständlich.

Für die Erkennung der Seiten entwickelte Transkribus eine App – DocScan – und das ScanTent. In Kombination können Seiten von Büchern schnell und simpel digitalisiert werden. Dabei erkennt die App automatisch, sobald eine Seite umgeblättert wird.
Handschriften, die bis ins 15. Jahrhundert zurückgehen, sind meist nicht leicht zu entziffern. Früher war Schreiben eine Art Kunsthandwerk, mit vielen Ornamenten und Verschnörkelungen. Nicht jeder individuelle Buchstabe glich dem anderen. Um ein komplettes Buch zu transkribieren, benötigt es daher einen Ground Truth von mindestens 50 Seiten. Was das heißt? Tippe manuell 50 Seiten in das Programm ein, den Rest übernimmt Transkribus automatisch.

Wird aus Transkribus bald TransCIBus?

Wer sich jetzt denkt: Das Vorgehen und die Begrifflichkeiten kommen mir doch irgendwie bekannt vor… Richtig gedacht! Mit unseren Forschungsprojekten CIB DeepER und CIB deep post-it (Zusammenarbeit mit BlitzMinds) forscht CIB ebenfalls an Projekten mit OCR und Handschriftenerkennung. Mit doXisafe und der doXibox bzw. der doXicrate haben wir drei super Produkte, die mit dem gleichen Prinzip wie das ScanTent und die DocScan App arbeiten.

Daher ist eine Kooperation mit der READ-COOP SCE für uns ein spannendes Thema. Technischer Austausch, gegenseitig voneinander profitieren und Lösungen optimieren sind unsere Ziele. Transkribus arbeitet mit dem Polytechnikum in Valencia zusammen an der Forschung zur Segmentierung und Strukturerkennung. Und wie es der Zufall so will, haben wir einen Standort in Valencia. Perfekte Voraussetzungen für eine Zusammenarbeit!

Vielleicht kann CIB ja neben Texterkennung in PDF Dokumenten, bald auch handschriftliche Schätze in historischen Schriften finden 😉

Teile diesen Post: