ZF IT Generation

ZF IT Generation. Alex Bărdăhan, fondator al Extracta – soluţie pentru extragere de date din documente nestructurate: Vom lansa oficial soluţia la finalul lunii martie şi ne aşteptăm să ajungem la venituri lunare recurente de 20.000 euro anul acesta

26 ian 2024 Autor: Ioana Nita

Investiţia folosită până acum pentru crearea soluţiei Extracta se situează la circa 100.000 de euro.

Start-up-ul local Extracta, care dezvoltă o soluţie bazată pe AI ce extrage date din documente nestructurate precum CV-uri, chitanţe sau documente de transport, estimează că va ajunge anul acesta la venituri lunare recurente de 20.000 de euro, lansarea oficială a soluţiei urmând să aibă loc la finalul lunii martie. În prezent, soluţia este în faza beta, fiind de fapt un API (application programming interface) pe care programatorii îl pot implementa în diferite soluţii software.

„Am finalizat MVP-ul acum trei luni, iar de atunci am tot testat soluţia în diverse scenarii, iar în momentul de faţă implementăm noua strategie pe care o avem în urma unui pivot pentru că iniţial strategia noastră a fost să mergem către companiile care procesează un număr mare de documente. Dar ne-am dat seama că noi nu vrem să ne adresăm direct companiilor, ci vrem să mergem prin intermediari, prin developeri, mai exact, pentru că ei ajung să implementeze tehnologia pe care noi am dezvoltat-o. Practic, ceea ce vindem nu este chiar un produs, ci este un API. Pentru cei care nu ştiu, un API înseamnă o mică bucată de aplicaţie, o tehnologie, care se poate integra în alte aplicaţii. Tocmai de aceea, soluţia pe care noi o dăm are într-adevăr în spate un dashboard web în care utilizatorii pot să testeze, dar în final, soluţia va fi imple­mentată prin cod în alte software -uri“, a spus Alex Bărdăhan, fondator al Extracta, în cadrul emisiunii ZF IT Generation. El a pus bazele proiec­tului Extracta în vara anului trecut, ideea pornind de la un alt start-up pe care l-a fondat.

„Noi aveam un produs de generare de descrieri pentru produse folosind AI numit ProDescription.ai. Acesta ajută proprietarii de magazine online să genereze descrieri complete, optimizate SEO pentru podusele pe care le vând online. Ajungând în contact cu un marketplace destul de mare cu care am discutat, acesta avea nevoie, pe lângă partea de generare de descrieri, şi de partea de filtre.“

„În mod normal, pentru fiecare produs un operator uman trebuie să introducă manual, pe baza descrierii, fiecare dintre filtre – cum ar fi mărime, culoare, etc, ceea ce durează foarte mult ca timp, mai ales dacă vorbim de 10 -15 filtre pe produs. Iar marketplace-ul vroia să automatizeze procesul ăsta şi pentru fiecare produs, noi, pe baza descrierii, să extragem automat cuvintele cheie pe care ei voiau să le obţină. Astfel, ne-am dat seama că noi putem să extragem date din texte, dar asta putem să facem acelaşi lucru şi pentru documente“, a relatat fondatorul Extracta, punctând faptul că pentru a extrage datele, start-up-ul foloseşte „large language models“ (LLM).

Soluţia creată de Extracta funcţionează în prezent pentru 27 de limbi, start-up-ul ţintind din start piaţa globală. “Ţintim ţările din vest pentru că acolo forţa de muncă e mai scumpă şi au mai multe motive să vrea să automatizeze acest proces. În principal, ne uităm la ţările vorbitoare de limbă engleză - acolo facem promovarea. Cu toate astea, developerii cam din orice ţară caută ceea ce caută pe internet în engleză”, a precizat Alex Bărdăhan.

Echipa Extracta a testat deja soluţia cu mai multe companii care dezvoltă software.

“Majoritatea companiilor sunt din zona de software, tocmai pentru că noi pe ele le ţintim în primul rând pentru că ne înţelegem la acelaşi nivel, noi la bază fiind o firmă de software. Şi, în al doilea rând, programatorii sunt cei care practic lucrează cu clientul final şi pentru noi este mult mai uşor. Noi pur şi simplu furnizăm această soluţie şi o integrăm în soluţii mai mari dezvoltate de alte companii”, a punctat el.

Deşi se pretează şi pentru zona de facturare, unde sunt multe soft-uri pentru facturare care au nevoie să extragă datele din facturi şi pentru care au apărut deja o serie de soluţii, start-up-ul nu vrea să atace această zonă, ci mai degrabă zonele unde datele trebuie extrase din documente nestructurate.

“Vrem să mergem mai mult către documentele care nu au primit atât de multă atenţie până acum şi pentru care nu prea există soluţii. Aici vorbim mai mult de documente nestructurate, cum ar fi CV -uri, chitanţe, diverse formulare, documente de transport. Vreau să mergem şi pe partea de documente scrise de mână pentru că acolo e o problemă destul de mult ocolită de jucătorii mari din piaţă pentru că este şi foarte greu de altfel.”

În ceea ce priveşte monetizarea, start-up-ul vrea să perceapă un tarif de circa 10 euro cenţi per pagină din care se extrag datele, astfel încât clienţii să plătească doar pentru cât folosesc soluţia.

 

O campanie Ziarul Financiar Partener: BCR