Opracowanie inteligentnego narzędzia AI do ekstrakcji informacji z dokumentów, wyszukiwania informacji i streszczania dokumentów celem automatyzacji procesów związanych z wielopoziomowym przetwarzaniem i analizą danych nieustrukturyzowanych.
Numer_referencyjny_programu_pomocowego: SA.41471(2015/X) Przeznaczenie_pomocy_publicznej: art. 25 rozporządzenia KE nr 651/2014 z dnia 17 czerwca 2014 r. uznające niektóre rodzaje pomocy za zgodne z rynkiem wewnętrznym w stosowaniu art. 107 i 108 Traktatu (Dz. Urz. UE L 187/1 z 26.06.2014). Projekt dotyczy opracowania modułów kompleksowej platformy do automatyzacji procesów związanych z przetwarzaniem dokumentów (nieustrukturyzowanych danych). Zaplanowane prace B+R obejmują przełamanie wyzwań technologicznych związanych z opracowaniem: (i) modułów realizujących zadania NER (ang. Named Entity Recognition), semantyczne porównywanie tekstu, streszczanie dokumentów w oparciu o wspólny model języka dla długich dokumentów, (ii)skutecznej metody, która pozwoli uczyć moduł AI na niewielkiej liczbie przykładów (z wykorzystaniem uczenia z transferem), (iii)autorskiego mechanizmu samo testującego, który pozwalać będzie na przetestowanie czy klocek AI (np. NER) zadziała prawidłowo dla danego przykładu / dokumentu lub istnieje ryzyko, że AI popełni błąd (np. gdy mamy do czynienia z przykładem anomalnym lub istotnie odstającym od danych treningowych), (iv)technologii do uczenia ciągłego, które bezpośrednio może być zastosowana do głębokich modeli języka i zadań NLP. Rezultatem będzie znacząco ulepszony produkt (oprogramowanie) umożliwiające przetwarzanie dokumentów w zakresie: -ekstrakcji informacji z użyciem technik NER – rozpoznawaniu wybranych słów lub fraz jako informacji, które mają być wyekstrahowanego z danego dokumentu, -semantyczne porównywanie tekstu (ang. semantic comparison) – porównywaniu fragmentów dokumentu z wybranym paragrafem / wyrażeniem w celu streszczenia go tylko do istotnych części w kontekście wybranego paragrafu / fragmentu. Bazuje ono na rozszerzeniu modelu języka do tzw. architektury syjamskiej, -streszczanie dokumentów – skróceniu do najważniejszych informacji. Bazuje na technikach nienadzorowanych do streszczania dokumentów (…).
Twój opis projektu
MiAby dodać zdjęcie, opis lub załączyć inne materiały dotyczące projektu, powinieneś wypełnić poniższy formularz. Po kliknięciu przycisku „wyślij” zostanie przesłana do Ciebie wiadomość e-mail z prośbą o potwierdzenie. Do przesłania formularza niezbędne jest zaakceptowanie Regulaminu Mapy Dotacji UE oraz zgoda na przetwarzanie danych osobowych. Materiały zostaną przesłane do redaktora serwisu, który po sprawdzeniu opublikuje je na stronie.