"Платформа ОФД" представила технологию умной потоковой обработки данных из чеков.
Розничная торговля » FMCG сети
Розничная торговля » DIY & Household Retail
Розничная торговля » Сети компьютерной техники
Розничная торговля » Сети бытовой техники
Розничная торговля » Прочие торговые сети
Розничная торговля » Общественное питание
Розничная торговля » DIY & Household Retail
Розничная торговля » Сети компьютерной техники
Розничная торговля » Сети бытовой техники
Розничная торговля » Прочие торговые сети
Розничная торговля » Общественное питание
08.09.2021 в 17:06 | INFOLine, ИА (по материалам компании) | Advis.ru
Компания обнаружила: грамматические ошибки, опечатки и сокращения допускаются в 60-65% кассовых чеков из магазинов
IT-компания "Платформа ОФД" ежедневно обрабатывает 48 - 50 млн кассовых чеков в день. В системе компании уже 55 млрд фискальных документов.
На основе накопленного опыта работы с агрегированными обезличенными данными – компания разработала собственное ноу-хау - технологию обработки коротких текстов, которая позволяет точно определять и идентифицировать товары и категории, указанные в чеках.
Процесс обработки происходит в режиме реального времени, позволяя в "потоке" фискальных документов скоростью более 1 000 транзакций в секунду - классифицировать, сравнивать и верифицировать товарные записи, в том числе содержащие грамматические ошибки.
О применении технологии рассказал в ходе пресс-конференции "5 лет системе ОФД и онлайн-касс в России" Алексей Баров, генеральный директор "Платформы ОФД", крупнейшего оператора фискальных данных страны.
"Часто в чеках встречается короткое наименование товара и его характеристик, либо в названии допущены ошибки или опечатки. Это связано с ограничениями по объему символов в строках фискальных документах, которые выдаются покупателю. Другая причина – пресловутый человеческий фактор.
Благодаря технологиям Machine Learning и накопленной за несколько лет экспертизе в данных, мы научили нейросети нашей системы четко, оперативно, с минимум погрешностей – распознавать и анализировать поступающую информацию. Это позволяет находить смыслы в наборе букв и цифр.
Сегодня такая потоковая обработка охватывает до 21 миллиона товаров (SKU) из 3,5 тыс. категорий, с 6 уровнями вложенности. С ростом объема данных, технология будет совершенствоваться и становиться "умнее". Мы планируем развивать это направление еще интенсивнее", - отметил Алексей Баров.
База для работы с короткими текстами "Платформы ОФД" на данный момент включает 5 млрд уникальных записей товаров, 150 млн написаний товаров в день. На потоке определяется более 3 млн брендов. При этом данные для классификации агрегируются как из чеков, так и из свободного доступа (отраслевые классификаторы/ каталоги с сайтов ретейлеров/ данные маркировки).
Ноу-хау помогло выявить, какова доля чеков с сокращениями и ошибками. По оценкам "Платформы ОФД", грамматические ошибки, опечатки и сокращения ежедневно допускаются в 60-65% всех чеков из продуктовой розничной торговли. При этом еще два года назад этот показатель был на уровне 80-85%. Меньше всего неточностей в фискальных документах организаций и предпринимателей сектора медицинских услуг – порядка 20-25%.
____________________________________________________________
IT-компания "Платформа ОФД" (ООО "Эвотор ОФД") - оператор фискальных данных (ОФД), электронного документооборота (ЭДО) и электронной отчетности. Компания ежедневно обрабатывает и передает в ФНС и оператору системы маркировки товаров ЦРПТ свыше 48 млн кассовых чеков.
№1 в рейтинге российских ОФД по версии CNews Analytics, лауреат премии CNEWS AWARDS в номинации "ИТ-проект года для ритейла". Входит в экосистему Сбера. Официальный сайт — platformaofd.ru
IT-компания "Платформа ОФД" ежедневно обрабатывает 48 - 50 млн кассовых чеков в день. В системе компании уже 55 млрд фискальных документов.
На основе накопленного опыта работы с агрегированными обезличенными данными – компания разработала собственное ноу-хау - технологию обработки коротких текстов, которая позволяет точно определять и идентифицировать товары и категории, указанные в чеках.
Процесс обработки происходит в режиме реального времени, позволяя в "потоке" фискальных документов скоростью более 1 000 транзакций в секунду - классифицировать, сравнивать и верифицировать товарные записи, в том числе содержащие грамматические ошибки.
О применении технологии рассказал в ходе пресс-конференции "5 лет системе ОФД и онлайн-касс в России" Алексей Баров, генеральный директор "Платформы ОФД", крупнейшего оператора фискальных данных страны.
"Часто в чеках встречается короткое наименование товара и его характеристик, либо в названии допущены ошибки или опечатки. Это связано с ограничениями по объему символов в строках фискальных документах, которые выдаются покупателю. Другая причина – пресловутый человеческий фактор.
Благодаря технологиям Machine Learning и накопленной за несколько лет экспертизе в данных, мы научили нейросети нашей системы четко, оперативно, с минимум погрешностей – распознавать и анализировать поступающую информацию. Это позволяет находить смыслы в наборе букв и цифр.
Сегодня такая потоковая обработка охватывает до 21 миллиона товаров (SKU) из 3,5 тыс. категорий, с 6 уровнями вложенности. С ростом объема данных, технология будет совершенствоваться и становиться "умнее". Мы планируем развивать это направление еще интенсивнее", - отметил Алексей Баров.
База для работы с короткими текстами "Платформы ОФД" на данный момент включает 5 млрд уникальных записей товаров, 150 млн написаний товаров в день. На потоке определяется более 3 млн брендов. При этом данные для классификации агрегируются как из чеков, так и из свободного доступа (отраслевые классификаторы/ каталоги с сайтов ретейлеров/ данные маркировки).
Ноу-хау помогло выявить, какова доля чеков с сокращениями и ошибками. По оценкам "Платформы ОФД", грамматические ошибки, опечатки и сокращения ежедневно допускаются в 60-65% всех чеков из продуктовой розничной торговли. При этом еще два года назад этот показатель был на уровне 80-85%. Меньше всего неточностей в фискальных документах организаций и предпринимателей сектора медицинских услуг – порядка 20-25%.
____________________________________________________________
IT-компания "Платформа ОФД" (ООО "Эвотор ОФД") - оператор фискальных данных (ОФД), электронного документооборота (ЭДО) и электронной отчетности. Компания ежедневно обрабатывает и передает в ФНС и оператору системы маркировки товаров ЦРПТ свыше 48 млн кассовых чеков.
№1 в рейтинге российских ОФД по версии CNews Analytics, лауреат премии CNEWS AWARDS в номинации "ИТ-проект года для ритейла". Входит в экосистему Сбера. Официальный сайт — platformaofd.ru
Введите e-mail получателя:
Укажите Ваш e-mail:
Получить информацию:
Получить информацию:
Специальное предложение
Не упустите возможности воспользоваться бонусами при покупке одного из самых рейтинговых обзоров INFOLine «Рынок DIY 2024 года».
В пакет входит бесплатное предложение:
- подписка на еженедельный отраслевой мониторинг «Рынок строительно-отделочных материалов, торговые сети DIY и товары для дома России и Республики Беларусь» II квартал 2024 года,
- свежий выпуск ежемесячного обзора «Инвестиционные проекты в жилищном строительстве РФ»,
- презентация INFOLine c бизнес-завтрака «Строительные материалы и рынок DIY. Итоги 2023 года, перспективы 2024-го».
Свяжитесь с нами любым удобным способом:
+7 (812) 322-68-48, +7 (495) 772-76-40
retail@infoline.spb.ru
Или напишите сообщение через бот https://t.me/INFOLine_auto_Bot – он сразу сообщит специалистам отдела развития INFOLine о вашем обращении.