Auf Schatzsuche mit dem Handschriftenerkennungstool Transkribus

Jahrhunderte alte Schriften mühelos entziffern und dabei auf literarische Schätze wie beispielsweise bisher unbekannte Notizen und Zeichnungen von van Gogh stoßen. Eine Phantasie, die für viele Bibliothekare und Historiker dank Transkribus endlich wahr wird.

Doch was ist Transkribus eigentlich?

Handschriftenerkennung, Layout Analyse und Strukturerkennung sind hier die Schlagworte. Transkribus ist ein Programm, das auf die Erkennung von historischen Handschriften spezialisiert und für jeden frei zugänglich ist. Es ist Teil der europäischen Genossenschaft READ-COOP SCE und wurde bei der Entwicklung des Tools staatlich unterstützt.

Bei der zweitägigen Transkribus User Conference in Innsbruck lernten wir alles über die richtige Anwendung, zukünftige Funktionen und erfolgreiche Projekte der Plattform Transkribus. Selbst mit fehlender Expertise im Bereich OCR – oder generell im Bereich Informatik – war es spannend und gut verständlich.

Für die Erkennung der Seiten entwickelte Transkribus eine App – DocScan – und das ScanTent. In Kombination können Seiten von Büchern schnell und simpel digitalisiert werden. Dabei erkennt die App automatisch, sobald eine Seite umgeblättert wird.
Handschriften, die bis ins 15. Jahrhundert zurückgehen, sind meist nicht leicht zu entziffern. Früher war Schreiben eine Art Kunsthandwerk, mit vielen Ornamenten und Verschnörkelungen. Nicht jeder individuelle Buchstabe glich dem anderen. Um ein komplettes Buch zu transkribieren, benötigt es daher einen Ground Truth von mindestens 50 Seiten. Was das heißt? Tippe manuell 50 Seiten in das Programm ein, den Rest übernimmt Transkribus automatisch.

Wird aus Transkribus bald TransCIBus?

Wer sich jetzt denkt: Das Vorgehen und die Begrifflichkeiten kommen mir doch irgendwie bekannt vor… Richtig gedacht! Mit unseren Forschungsprojekten CIB DeepER und CIB deep post-it (Zusammenarbeit mit BlitzMinds) forscht CIB ebenfalls an Projekten mit OCR und Handschriftenerkennung. Mit doXisafe und der doXibox bzw. der doXicrate haben wir drei super Produkte, die mit dem gleichen Prinzip wie das ScanTent und die DocScan App arbeiten.

Daher ist eine Kooperation mit der READ-COOP SCE für uns ein spannendes Thema. Technischer Austausch, gegenseitig voneinander profitieren und Lösungen optimieren sind unsere Ziele. Transkribus arbeitet mit dem Polytechnikum in Valencia zusammen an der Forschung zur Segmentierung und Strukturerkennung. Und wie es der Zufall so will, haben wir einen Standort in Valencia. Perfekte Voraussetzungen für eine Zusammenarbeit!

Vielleicht kann CIB ja neben Texterkennung in PDF Dokumenten, bald auch handschriftliche Schätze in historischen Schriften finden 😉

Teile diesen Post:

Update: Protect our Privacy (PoP)

Nach CIB deepER geht es jetzt mit CIB PoP weiter:

Für den Antrag unseres neuen Förderprojektes: CIB PoP (Protect our Privacy) haben wir vom Projektträger VDI/VDE die erfreuliche Nachricht bekommen, dass unser Projekt für eine weitere Qualifizierung empfohlen wurde. Wir sind eine Runde weiter und befinden uns damit in der engeren Auswahl für eine erfolgreiche Zusage.

Die Daumen sind weiterhin gedrückt, doch wir sind sicher, dass unsere Projektskizze überzeugt. Um mehr über das Forschungsprojekt zu erfahren, folgt dem Link zum Beitrag aus dem Oktober 2018.

Wir halten euch natürlich auf dem Laufenden – Let’s CIB #PoP

Teile diesen Post:

DeepER auf der BMBF-Mittelstandskonferenz 2018 in Berlin

Das Bundesministerium für Bildung und Forschung (BMBF) veranstaltete Anfang dieser Woche unter dem Motto „KMU gestalten die Digitalisierung“ die 6. Fachtagung zum Förderschwerpunkt „KMU-innovativ“ als Mittelstandskonferenz. Mehr als 50 Unternehmen und 450 Teilnehmer besuchten die Veranstaltung, um aktuelle Forschungsprojekte und Innovationen zu präsentieren und kennenzulernen.

CIB war in Berlin durch zahlreiche Mitarbeiter vertreten. Geschäftsführer Ulrich Brandner präsentierte den Besuchern das in Zusammenarbeit mit dem Fraunhofer IAIS (Institut für Intelligente Analyse und Informationssysteme) durchgeführte KI-Projekt DeepER.

DeepER steht für eine OCR-Engine, die sich mit Hilfe von künstlicher Intelligenz ständig weiterentwickelt. Am CIB-Stand konnten sich die Besucher selbst von der Qualität der Texterkennung überzeugen und ihre Geschicklichkeit beim Gewinnspiel „Bau mich auf“ mit unserer doXibox unter Beweis stellen.

Ulrich Brandner nutzte die Gelegenheit und repräsentierte CIB als Teilnehmer der Podiumsdiskussion mit Fokus auf die Bedeutung von KMU-innovativ. Die CIB-Mitarbeiter konnten im „Science-Dating“ erste Kontakte mit potenziellen Forschungspartnern für zukünftige Projekte knüpfen.

Die Teilnahme war eine willkommene Gelegenheit unser Unternehmen und unsere Lösungen vorzustellen.

Let’s CIB!

 

Teile diesen Post:

CIB does OCR

OCR steht für Optical Character Recognition, das heisst, Texterkennung oder optische Zeichenerkennung.

Der CIB-Baustein CIB ocr ist in unseren Lösungen CIB doXiview, CIB doXisafe-App (Google Play / App Store), CIB doXisafe Web, CIB doxima sowie auf unserer Crowdsourcing-Plattform ocr.team integriert und kann kostenlos und ohne Registrierung verwendet werden.

Warum OCR?

Schon einmmal während einer Präsentation als Mitschrift Fotos der Slides gemacht? Aus all den Slides dann den einen bestimmten Abschnitt gesucht? Und den darin enthaltenen Text dann mühsam abgetippt?

Mit CIB ocr kann eine gescannte Unterlage, ein PDF-Dokument oder einfach nur ein Bild auf darin enthaltenen Text durchsucht werden! Der gefundene Text kann übernommen und sogleich in einem Textverarbeitungsprogramm eingebunden werden.
Das bedeutet, Schluss mit Abtippen! Einfach mit Hilfe von OCR den Text extrahieren und verwenden.

Und dann wurde es DeepER:

CIB hat in Zusammenarbeit mit dem Fraunhofer Institut und dem Bundesministerium für Forschung und Innovation (BMFI) ein OCR-System auf Basis von künstlicher Intelligenz, unser CIB DeepER entwickelt.

CIB DeepEr ermöglicht die Texterkennung von fotografierten oder gescannten Bildern. Der enthaltene Text wird dabei mit Hilfe einer  Künstlichen Intelligenz (KI) extrahiert und kann über CIB doXiview korrigiert werden. Die zugrunde liegende KI lernt mit jedem Bild und jeder Datei die verarbeitet wird und verbessert sich damit fortlaufend – bis hin zur perfekten Texterkennung.

In diesem Sinne: Mitmachen und let’s CIB!

Teile diesen Post:

Mit KI in die Zukunft

Künstliche Intelligenz, Machine Learning, Neuronale Netze und Deep Learning, alles brisante Themen, die am 28. und 29.09. auf dem KI-Festival in Nürnberg unter die Lupe genommen wurden. Unser DeepER Team bestätigt: kein „Tech-Talk“,  sondern viele spannende Schwerpunkte wurden diskutiert – von Mathematik und Informatik, der Bedeutung von KI für Daten und Qualität, sinnvolle Einsatzbereiche bis hin zu Grenzen und auch Ängsten, die im Zusammenhang mit dem Thema entstehen können.

Künstliche Intelligenz kann lange nicht mehr als Hype bezeichnet werden und ihr möglicher Beitrag zum Unternehmenserfolg wird mittlerweile in allen Branchen als wichtiges Thema wahrgenommen.

Auch unsere Business Scouts Andreas Brandner und Leonhard Schiele konnten das auf dem AI Summit in San Francisco erleben und haben viele interessante Eindrücke mitgebracht. Dort wurde besonders die Gefahr diskutiert, dass firmenintern entwickelte KI-Themen nach Fertigstellung oft nicht zum Einsatz kommen.

Hier findest du alle im AI Summit vorgestellten Projekte.

Bei CIB sind neben ocr.team, unserer Crowdsourcingplattform für OCR mit doXiview, weitere neue Themen im Bereich Künstliche Intelligenz im Aufbau.

In den nächsten Wochen gibt´s in diesem Blog mehr zum Thema!

Let´s CIB!

 

 

 

 

Teile diesen Post:

AI Summit San Francisco mit CIB

Das größte Event im Bereich Künstliche Intelligenz, das AI Summit San Francisco, lassen wir uns natürlich nicht entgehen!

Am 19. und 20 September nutzen wir die Möglichkeit, um viele praktische Anwendungsfälle und vor allem den Einsatz von Artificial Intelligence im Unternehmensumfeld zur Prozessverbesserung hautnah zu erleben.

Natürlich stehen wieder viele interessante Vorträge und Networking mit anderen Teilnehmern auf der Tagesordnung. Und somit wird sicher auch unsere kostenfreie Crowdsourcing Plattform auf ocr.team und unser Produkt DeepER zur Texterkennung auf Basis von neuronalen Netzen zur Sprache kommen.

Let´s go DeepER!

Teile diesen Post:

CIB sponsert SERVUS KI! FESTIVAL

Die Anwendungsmöglichkeiten der künstlichen Intelligenz entwickeln sich immer schneller. Großkonzerne investieren Milliarden in die Forschung.

Auch die CIB entwickelt Lösungen auf Basis von künstlicher Intelligenz: DeepER. CIB sponsert SERVUS KI! FESTIVAL weiterlesen

Teile diesen Post: