“Tabular data” é um termo amplo que abrange dados estruturados que geralmente se encaixam em uma linha e coluna específicas. Pode ser um banco de dados SQL, uma planilha, um arquivo .CSV, etc. Enquanto houve um tremendo progresso na aplicação de inteligência artificial a dados não estruturados e sequenciais, esses grandes modelos de linguagem (LLMs) são propositalmente imprecisos. Eles são construídos para manipular tokens de entrada e gerar uma saída coerente sem necessariamente seguir uma estrutura fixa. Os melhores LLMs também são caros para acessar via API ou caros para executar em sua própria infraestrutura de nuvem.

E, no entanto, muitas empresas já têm uma estratégia de dados com um data warehouse ou data lake para centralizar todos os dados importantes e alguns cientistas de dados que podem alavancar esses dados para melhorar a estratégia da empresa. A startup francesa Neuralk-AI é uma empresa de inteligência artificial que tem trabalhado em modelos de IA focados em dados tabulares. A empresa anunciou esta semana um financiamento de US$ 4 milhões. “Dados com valor real para as empresas são dados que foram identificados há muito tempo, estruturados na forma de uma tabela e usados pelos cientistas de dados dessas empresas para criar todos os seus algoritmos de machine learning,” disse Alexandre Pasquiou, co-fundador e diretor científico da Neuralk-AI. Neuralk-AI acredita que há uma oportunidade em revisitar o desenvolvimento de modelos de IA, mas com um foco específico em dados estruturados. Em primeiro lugar, pretende oferecer seu modelo como uma API para os cientistas de dados que trabalham para empresas de comércio, pois essas empresas amam dados – pense em catálogos de produtos, bancos de dados de clientes, tendências de carrinho de compras, etc. “Hoje, os LLMs são ótimos para busca, interação natural com o usuário e responder a perguntas com base em documentos não estruturados. Mas tem algumas limitações no momento em que voltamos para a aprendizagem de máquina clássica, que realmente se baseia em dados tabulares clássicos,” disse Pasquiou.
Com a Neuralk-AI, os varejistas podem automatizar fluxos de trabalho de dados complexos com deduplicação inteligente e enriquecimento. Mas eles também poderiam usar os modelos da empresa para detectar fraudes, otimizar as recomendações de produtos e gerar previsões de vendas que poderiam ser usadas para gestão de estoque e precificação de produtos. A Fly Ventures liderou a rodada de US$ 4 milhões da empresa com a participação do Steam AI. Vários anjos investidores também apostaram na startup, como Thomas Wolf da Hugging Face, Charles Gorintin da Alan, e Philippe Corrot e Nagi Letaifa da Mirakl. A equipe ainda está trabalhando ativamente em seus modelos. Eles planejam testar com um grupo de principais varejistas franceses e startups de comércio, como E.Leclerc, Auchan, Mirakl e Lucky Cart. “Dentro de três ou quatro meses, lançaremos a primeira versão do nosso modelo e o benchmark público no qual poderemos classificar nosso modelo em comparação com o estado da arte neste espaço,” disse Pasquiou. “E em setembro, a ideia é ser o melhor modelo de base tabular em tudo relacionado à aprendizagem de representação.”
Leave a Reply