CIB DeepER 2.7.0 – Texterkennung jetzt auch auf Spanisch

Haben Sie schon mal versucht, Texte in einer Präsentation oder einem Text zu durchsuchen? Manuell ist es ziemlich mühselig. Aber unsere OCR-Lösung CIB DeepER ist darauf spezialisiert!

Aber zunächst einmal, wofür steht eigentlich OCR? Optical Character Recognition – oder ins Deutsche übersetzt – optische Zeichenerkennung. CIB DeepER ermöglicht Texterkennung aus Scans und Fotos. Der Text wird von künstlicher Intelligenz extrahiert und mit Hilfe unseres Viewers CIB doXiview erkannt.

Mit dem neuen Release 2.7.0 ist die Texterkennung neben Deutsch und Englisch jetzt auch auf Spanisch möglich!

CIB DeepER wurde als gemeinsames Projekt mit dem Fraunhofer Institut geboren und vom Bundesministerium für Forschung und Innovation (BMFI) finanziell gefördert. Damit war CIB einer der Vorreiter in der Entwicklung von einem OCR-System auf Basis von künstlicher Intelligenz. Eine Technologie, die gute Anwendung in der Digitalisierung findet, insbesondere in den Bereichen Buchhaltung und Archivierung.

OCR in der Buchhaltung

In der Buchhaltung erweist sich die Anwendung von Texterkennungssoftware wie CIB DeepER als besonders effektiv:

  1. Eingegangene Papierrechnungen werden eingescannt.
  2. Die OCR-Technologie wandelt die grafischen Daten in maschinenlesbare Informationen um.
  3. Die Abrechnungssoftware erzeugt eine digitale Kopie der Rechnung und stellt sie zur weiteren Bearbeitung zur Verfügung.

Die Vorteile sind klar:

  • Die involvierten Mitarbeiter bekommen schnellen Zugriff auf die Daten.
  • Die manuelle Dateneingabe entfällt und Fehler werden dadurch vermieden.
  • Der Arbeitsprozess wird verbessert und die Produktivität gesteigert.

OCR in der Archivierung

Papierunterlagen manuell zu indexieren ist extrem mühsam:

  1. Man muss sie einscannen.
  2. Der vollständige Text muss ausgewertet werden.
  3. Relevante Stichworte müssen zugewiesen werden.
  4. Das Dokument muss korrekt in der Archivstruktur abgelegt werden.

Eine automatische Texterkennung, wie es mit CIB DeepER möglich ist, bietet einige Vorteile:

  • Die Suche nach relevanten Stichworten passiert automatisch.
  • Mit Hilfe von künstlicher Intelligenz wird die Texterkennung kontinuierlich verbessert.
  • Die Technologie kann in Ihr bestehendes Archiv eingebaut werden, oder Sie können sie in Verbindung mit einer unserer Dokumentenablagelösungen wie CIB doXigate, CIB doXisafe oder CIB doXima verwenden.

Möchten Sie mehr über CIB DeepER erfahren? Klicken Sie hier.

Haben Sie Fragen? Sie erreichen uns unter +49 89 143 60 – 300 oder per E-Mail an info@cib.de.

Teile diesen Post:

Auf Schatzsuche mit dem Handschriftenerkennungstool Transkribus

Jahrhunderte alte Schriften mühelos entziffern und dabei auf literarische Schätze wie beispielsweise bisher unbekannte Notizen und Zeichnungen von van Gogh stoßen. Eine Phantasie, die für viele Bibliothekare und Historiker dank Transkribus endlich wahr wird.

Doch was ist Transkribus eigentlich?

Handschriftenerkennung, Layout Analyse und Strukturerkennung sind hier die Schlagworte. Transkribus ist ein Programm, das auf die Erkennung von historischen Handschriften spezialisiert und für jeden frei zugänglich ist. Es ist Teil der europäischen Genossenschaft READ-COOP SCE und wurde bei der Entwicklung des Tools staatlich unterstützt.

Bei der zweitägigen Transkribus User Conference in Innsbruck lernten wir alles über die richtige Anwendung, zukünftige Funktionen und erfolgreiche Projekte der Plattform Transkribus. Selbst mit fehlender Expertise im Bereich OCR – oder generell im Bereich Informatik – war es spannend und gut verständlich.

Für die Erkennung der Seiten entwickelte Transkribus eine App – DocScan – und das ScanTent. In Kombination können Seiten von Büchern schnell und simpel digitalisiert werden. Dabei erkennt die App automatisch, sobald eine Seite umgeblättert wird.
Handschriften, die bis ins 15. Jahrhundert zurückgehen, sind meist nicht leicht zu entziffern. Früher war Schreiben eine Art Kunsthandwerk, mit vielen Ornamenten und Verschnörkelungen. Nicht jeder individuelle Buchstabe glich dem anderen. Um ein komplettes Buch zu transkribieren, benötigt es daher einen Ground Truth von mindestens 50 Seiten. Was das heißt? Tippe manuell 50 Seiten in das Programm ein, den Rest übernimmt Transkribus automatisch.

Wird aus Transkribus bald TransCIBus?

Wer sich jetzt denkt: Das Vorgehen und die Begrifflichkeiten kommen mir doch irgendwie bekannt vor… Richtig gedacht! Mit unseren Forschungsprojekten CIB DeepER und CIB deep post-it (Zusammenarbeit mit BlitzMinds) forscht CIB ebenfalls an Projekten mit OCR und Handschriftenerkennung. Mit doXisafe und der doXibox bzw. der doXicrate haben wir drei super Produkte, die mit dem gleichen Prinzip wie das ScanTent und die DocScan App arbeiten.

Daher ist eine Kooperation mit der READ-COOP SCE für uns ein spannendes Thema. Technischer Austausch, gegenseitig voneinander profitieren und Lösungen optimieren sind unsere Ziele. Transkribus arbeitet mit dem Polytechnikum in Valencia zusammen an der Forschung zur Segmentierung und Strukturerkennung. Und wie es der Zufall so will, haben wir einen Standort in Valencia. Perfekte Voraussetzungen für eine Zusammenarbeit!

Vielleicht kann CIB ja neben Texterkennung in PDF Dokumenten, bald auch handschriftliche Schätze in historischen Schriften finden 😉

Teile diesen Post:

Update: Protect our Privacy (PoP)

Nach CIB deepER geht es jetzt mit CIB PoP weiter:

Für den Antrag unseres neuen Förderprojektes: CIB PoP (Protect our Privacy) haben wir vom Projektträger VDI/VDE die erfreuliche Nachricht bekommen, dass unser Projekt für eine weitere Qualifizierung empfohlen wurde. Wir sind eine Runde weiter und befinden uns damit in der engeren Auswahl für eine erfolgreiche Zusage.

Die Daumen sind weiterhin gedrückt, doch wir sind sicher, dass unsere Projektskizze überzeugt. Um mehr über das Forschungsprojekt zu erfahren, folgt dem Link zum Beitrag aus dem Oktober 2018.

Wir halten euch natürlich auf dem Laufenden – Let’s CIB #PoP

Teile diesen Post:

DeepER auf der BMBF-Mittelstandskonferenz 2018 in Berlin

Das Bundesministerium für Bildung und Forschung (BMBF) veranstaltete Anfang dieser Woche unter dem Motto „KMU gestalten die Digitalisierung“ die 6. Fachtagung zum Förderschwerpunkt „KMU-innovativ“ als Mittelstandskonferenz. Mehr als 50 Unternehmen und 450 Teilnehmer besuchten die Veranstaltung, um aktuelle Forschungsprojekte und Innovationen zu präsentieren und kennenzulernen.

CIB war in Berlin durch zahlreiche Mitarbeiter vertreten. Geschäftsführer Ulrich Brandner präsentierte den Besuchern das in Zusammenarbeit mit dem Fraunhofer IAIS (Institut für Intelligente Analyse und Informationssysteme) durchgeführte KI-Projekt DeepER.

DeepER steht für eine OCR-Engine, die sich mit Hilfe von künstlicher Intelligenz ständig weiterentwickelt. Am CIB-Stand konnten sich die Besucher selbst von der Qualität der Texterkennung überzeugen und ihre Geschicklichkeit beim Gewinnspiel „Bau mich auf“ mit unserer doXibox unter Beweis stellen.

Ulrich Brandner nutzte die Gelegenheit und repräsentierte CIB als Teilnehmer der Podiumsdiskussion mit Fokus auf die Bedeutung von KMU-innovativ. Die CIB-Mitarbeiter konnten im „Science-Dating“ erste Kontakte mit potenziellen Forschungspartnern für zukünftige Projekte knüpfen.

Die Teilnahme war eine willkommene Gelegenheit unser Unternehmen und unsere Lösungen vorzustellen.

Let’s CIB!

 

Teile diesen Post:

CIB does OCR

OCR steht für Optical Character Recognition, das heisst, Texterkennung oder optische Zeichenerkennung.

Der CIB-Baustein CIB ocr ist in unseren Lösungen CIB doXiview, CIB doXisafe-App (Google Play / App Store), CIB doXisafe Web, CIB doxima sowie auf unserer Crowdsourcing-Plattform ocr.team integriert und kann kostenlos und ohne Registrierung verwendet werden.

Warum OCR?

Schon einmmal während einer Präsentation als Mitschrift Fotos der Slides gemacht? Aus all den Slides dann den einen bestimmten Abschnitt gesucht? Und den darin enthaltenen Text dann mühsam abgetippt?

Mit CIB ocr kann eine gescannte Unterlage, ein PDF-Dokument oder einfach nur ein Bild auf darin enthaltenen Text durchsucht werden! Der gefundene Text kann übernommen und sogleich in einem Textverarbeitungsprogramm eingebunden werden.
Das bedeutet, Schluss mit Abtippen! Einfach mit Hilfe von OCR den Text extrahieren und verwenden.

Und dann wurde es DeepER:

CIB hat in Zusammenarbeit mit dem Fraunhofer Institut und dem Bundesministerium für Forschung und Innovation (BMFI) ein OCR-System auf Basis von künstlicher Intelligenz, unser CIB DeepER entwickelt.

CIB DeepEr ermöglicht die Texterkennung von fotografierten oder gescannten Bildern. Der enthaltene Text wird dabei mit Hilfe einer  Künstlichen Intelligenz (KI) extrahiert und kann über CIB doXiview korrigiert werden. Die zugrunde liegende KI lernt mit jedem Bild und jeder Datei die verarbeitet wird und verbessert sich damit fortlaufend – bis hin zur perfekten Texterkennung.

In diesem Sinne: Mitmachen und let’s CIB!

Teile diesen Post:

Mit KI in die Zukunft

Künstliche Intelligenz, Machine Learning, Neuronale Netze und Deep Learning, alles brisante Themen, die am 28. und 29.09. auf dem KI-Festival in Nürnberg unter die Lupe genommen wurden. Unser DeepER Team bestätigt: kein „Tech-Talk“,  sondern viele spannende Schwerpunkte wurden diskutiert – von Mathematik und Informatik, der Bedeutung von KI für Daten und Qualität, sinnvolle Einsatzbereiche bis hin zu Grenzen und auch Ängsten, die im Zusammenhang mit dem Thema entstehen können.

Künstliche Intelligenz kann lange nicht mehr als Hype bezeichnet werden und ihr möglicher Beitrag zum Unternehmenserfolg wird mittlerweile in allen Branchen als wichtiges Thema wahrgenommen.

Auch unsere Business Scouts Andreas Brandner und Leonhard Schiele konnten das auf dem AI Summit in San Francisco erleben und haben viele interessante Eindrücke mitgebracht. Dort wurde besonders die Gefahr diskutiert, dass firmenintern entwickelte KI-Themen nach Fertigstellung oft nicht zum Einsatz kommen.

Hier findest du alle im AI Summit vorgestellten Projekte.

Bei CIB sind neben ocr.team, unserer Crowdsourcingplattform für OCR mit doXiview, weitere neue Themen im Bereich Künstliche Intelligenz im Aufbau.

In den nächsten Wochen gibt´s in diesem Blog mehr zum Thema!

Let´s CIB!

 

 

 

 

Teile diesen Post:

AI Summit San Francisco mit CIB

Das größte Event im Bereich Künstliche Intelligenz, das AI Summit San Francisco, lassen wir uns natürlich nicht entgehen!

Am 19. und 20 September nutzen wir die Möglichkeit, um viele praktische Anwendungsfälle und vor allem den Einsatz von Artificial Intelligence im Unternehmensumfeld zur Prozessverbesserung hautnah zu erleben.

Natürlich stehen wieder viele interessante Vorträge und Networking mit anderen Teilnehmern auf der Tagesordnung. Und somit wird sicher auch unsere kostenfreie Crowdsourcing Plattform auf ocr.team und unser Produkt DeepER zur Texterkennung auf Basis von neuronalen Netzen zur Sprache kommen.

Let´s go DeepER!

Teile diesen Post:

CIB sponsert SERVUS KI! FESTIVAL

Die Anwendungsmöglichkeiten der künstlichen Intelligenz entwickeln sich immer schneller. Großkonzerne investieren Milliarden in die Forschung.

Auch die CIB entwickelt Lösungen auf Basis von künstlicher Intelligenz: DeepER. CIB sponsert SERVUS KI! FESTIVAL weiterlesen

Teile diesen Post:

CIB stellt das Forschungsprojekt DeepER auf der Fachtagung „KMU-Innovativ: ITK“ vor

Am 10./11. Oktober 2016 findet die BMBF-Fachtagung zur Förderinitiative „KMU-Innovativ: ITK“ mit dem Titel „Mittelstand: Digital. Innovativ. Vernetzt.“ statt. CIB stellt zu dieser Gelegenheit das Forschungsprojekt DeepER zur Entwicklung einer innovativen OCR-Engine vor.

Seit über 27 Jahren stellt CIB software GmbH innovative und flexible Lösungen im Bereich Document Lifecycle Management mit dem Ziel her, Unternehmen die Optimierung und Automatisierung der Verwaltungsprozesse zu ermöglichen und damit eine deutliche Effizienzsteigerung im Unternehmen zu erreichen. 

Um den ständig wachsenden Anforderungen des Marktes und den Herausforderungen der globalen Digitalisierung anzupassen, investiert CIB in Forschung und Innovation.

Das vom Bildungsministerium geförderte Forschungsprojekt CIB DeepER (Deep learning Extended Range Character Recognition), bei dem CIB mit dem Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS zusammen arbeitet, startete Anfang Juli. 

Zielsetzung ist die Entwicklung einer intelligenten Software-Lösung zur optischen Zeichenerkennung, die auf deep learning Technologien aufbaut. 

Wie bereits in anderen Wissenschaftsbereichen wie der Spracherkennung oder der Bildklassifizierung, soll der wissenschaftliche Ansatz der Künstlichen Intelligenz auch im Bereich der Zeichenerkennung für einen Durchbruch sorgen.

Fachleute bestätigen, dass heute noch immer bis zu 60% der eingescannten Dokumente nachbearbeitet werden müssen. Für viele Anwendungsbereiche ein inakzeptables Ergebnis, das die Automatisierung der nachgelagerten Unternehmensprozesse erschwert. Ziel des Forschungsprojektes ist es, mit dieser neuen OCR-Engine die Qualität beim Auslesen von gescannten Dokumenten so zu verbessern, dass der Standard einer menschlichen Interpretation erreicht wird und damit der Aufwand einer Nachbearbeitung drastisch sinkt.

Die wissenschaftlichen Ansätze von dem Projekt DeepER werden Anfang Oktober auf der BMBF-Fachtagung zusammen mit der von CIB entwickelten Cloudplattform doXisafe, auf der die Forschung durch crowdtesting schnell voran getrieben werden soll, vorgestellt. Die Initiative mit dem Titel „Zusammen finden wir jede Lösung“ kann dabei kennen gelernt und getestet werden.

Das bestehende Produktportfolio von CIB wird von den vielversprechenden Forschungsergebnissen direkt profitieren, damit die Ergebnisse bei Verwendung der CIB Lösungen wie doXisafe oder doXiview, die dadurch noch performanter werden, weiter optimiert und die Prozessautomatisierung zusätzlich erleichtert werden.

Teile diesen Post: