Automatisches Festlegen von Treshhold in Segmentierung

Fevereiro 23, 2021
Tempo de leitura: 1 min

Bei der Segmentierung der Zeilen für Deeper erkennt das neuronale Netz, das der Segmentierung zu Grunde liegt, immer wieder falsche Zeilen. Allerdings werden diese falsch gefundenen Zeilen mit einer geringen Confidence (Sicherheit der Erkennung) versehen, weshalb sie zum größten Teil rausgefiltert werden können indem man ab einem gewissen Schwellwert diese Zeilen nicht in das Segmentierungsergebnis übernimmt. Bisher wurde dieser Schwellwert bei einem neu trainierten Netz händisch ermittelt. Das soll jetzt automatisch passieren.

Vorbereitung

Um den Trashhold bestimmen zu können werden teile des Produkts Cibtextcompare verwendet um die Positionen der erkannten Boxen mit einer Ground Trouth zu vergleichen. Dadurch, dass die Zeilen anders erkannt werden, als sie in unserer Testmenge hinterlegt sind müssen die Referenzdokumente erst auf das Gleiche Format geändert werden bis man die Zeilen miteinander Vergleichen kann.

Außerdem müssen auch die erkannten Zeilen unbearbeitet gespeichert werden, sodass das Ergebnis nicht verfälscht wird.

Vergleich

Sobald die zu vergleichenden erkannten Ergebnisse vorbereitet sind wird überprüft wie weit sich die Boxen überschneiden, und sobald eine Genügend große Überschneidung vorliegt werden die erkannten Zeilen, die nicht aus der Groundtrouth stammen, als valide markiert. Die Zeilen, die nicht für valide erklärt wurden werden daraufhin auf ihre Confidence überprüft. Übersteigt die größte Confidence der als falsch markierten Zeilen keine einzige Confidence der validen Zeilen wird ein Trashhold minimal höher als die höchste Confidence der falsch erkannten Zeilen eingestellt und die falschen Zeilen werden künftig rausgefiltert.

Voltar ao blog

CIB Azubi

Automatisches Festlegen von Treshhold in Segmentierung

Vorbereitung

Vergleich

CIB Group

Especialistas em digitalização

Mais artigos

O fim da acumulação de documentos: Crie documentos sem barreiras, de forma totalmente automatizada, em dark processing

CIB 4 DayWeek: Estudo científico sobre a semana de 4 dias

CIB Valência: Como nossas colegas de Valência estão a ajudar as vítimas da DANA - e a CIB junta-se a elas!

CIB Teambuilding: Jantar de Natal para CIB labs em Las Palmas de Gran Canaria

BUSINESS TOOLS

Business CCM & BPM

Entrega de correio com um clique

Business Exchange

Soluções PDF para empresas

Facturação electrónica

FREE ONLINE TOOLS

Cloud segura

Edição de PDF no browser

Comprimir PDF

Mobile Apps

Assinatura digital

INTELIGÊNCIA ARTIFICIAL

CIB IA

Treinar a IA

Open Source

CIB PORTUGAL

Comercial

Support & Hotline

Empresa

Digitalização e Automatização

Setores

Case Studies

CIB User Group

Produtos

Cloud segura

PDF-Experten

Inteligência Artificial

Treinar a IA

Open Source

Documentação

CIB PORTUGAL

Comercial

Support & Hotline

Serviço de conversão de fontes

Empresa

For Business

CIB PORTUGAL

Comercial

Support & Hotline

Zum Anfrageformular

Empresa