Надежное хранение

и глубокий анализ Ваших данных

Много ли у Вас данных?

Термин «Большие данные» (Big Data) появился
как только многие компании столкнулись с
быстрым ростом информации. Это стало
большой проблемой как в хранении, так и
использовании накопленных годами данных.
Исключительное хранение информации не имеет
большой ценности и не может быть применено для
какой-либо оптимизации бизнеса. Мы знаем как
заставить Ваши данные работать.

Эффективное управление
информацией –
успех Вашего бизнеса

ТКомпании ABBYY и BAUM предлагают решение
способное превратить накопленные данные
Заказчика в ценные бизнес-активы, с помощью
которого возможно зарабатывать деньги, и
это решение доступно как крупному, так и
среднему и малому бизнесу. Решение представляет
собой гибко-масштабируемую унифицируемую
систему хранения BAUM U-серии и кластера
серверов с глубоким семантико-синтаксическим
анализом теста ABBYY Compreno.

Отличительными особенностями систем хранения данных BAUM U-серии являются:

  • Предоставление как блочного так и файлового доступа, без использования дополнительных файловых шлюзов;
  • Надежность как на программном, так и на аппаратном уровне;
  • Возможность применения онлайн дедупликации для обеспечения эффективного хранения информации;
  • Использование двухуровнего кэширования данных, позволяющего обеспечить максимальную производительность дискового хранилища;
  • Использование большого объема кэш на запись до 6,4Тб на пару контроллеров и неограниченного объема кэш на чтение;
  • Масштабируемость до 18 Пб на систему;
  • Автоматическая оптимизация ввода/вывода;
  • Создание мгновенных снимков для быстрого восстановления;
  • Глубокая интеграция с приложениями;
  • Балансировка нагрузки между контроллерами;
  • Возможность построения катастрофоустойчивой инфраструктуры хранения данных;

Работа ABBYY Compreno проходит в 4 этапа:

  • 1 этап. Лексико-морфологический анализ.
    На этом этапе исходный текст делится на абзацы, предложения и слова, технология определяет части речи и морфологические признаки слов (род, число, падеж и другие)
  • 2 этап. Синтаксический анализ.
      Технология выделяет предложения в тексте, определяет их структуру и связи между словами в предложении.
  • 3 этап. Семантический анализ.
    ABBYY Compreno определяет значения каждого слова, строит семантическую структуру предложения на основе связей, которые были установлены на прошлом этапе.
  • 4 этап. Прагматический уровень анализа.
    На этом этапе накладывается прагматический слой анализа текста, применяются онтологии (терминология для конкретной предметной области анализа) и правила извлечения нужных объектов.

Результатом анализа является универсальное представление информации, что позволяет структурировать контент в нужном заказчику виде. Таким образом, ABBYY Compreno позволяет эффективно решать задачи клиента, связанные с анализом и извлечением важных фактов, интеллектуальным поиском и классификацией информации.

Поддерживаемые форматы

  • Текстовые документы (*.rtf, *.doc, *.docx, *.txt, *.odt, *.xml)
  • Веб-страницы (*.html, *.htm)
  • Презентации (*.ppt, *.pps, *.pptx, *.ppsx, *.odp)
  • Таблицы (*.xls, *.xlsx, *.ods)
  • Документы Adobe (*.idml, *.mif)
  • Файлы ресурсов (*.dll, *.exe, *.resx, *.rc)
  • Письма MS Outlook (*.pst)
  • Архивные (*.rar, *.zip)
  • PDF files (*.pdf) *
  • Графические файлы (*.pdf, *.jpeg, *.jpg, *.bmp, *.gif, *.tif, *.tiff, *.png, *.djvu, *.dcx, *.dib, *.jb2, *.pcx, *.wdp) *

Файлы других форматов также будут проиндексированы, но в индекс будут записаны только их метаданные.

*Для работы с графическими файлами требуется решение для распознавания ABBYY Recognition Server версии 3.5 и выше.

Применение и преимущества решения

С решением ABBYY и BAUM Вы можете:

  • Добиться высокой точности и полноты результатов анализа с максимальной скоростью доступа к данным;
  • Достичь качественного анализа данных при минимальном предварительном обучении;
  • Проводить автоматическое тэгирование документов, файлов;

Применение данного решения может быть применено в Вашей организации в совершенно разных департаментах и их конкретных системах:

HR/Отдел кадров

Обработка данных из резюме. Позволит ускорить извлечение ключевой информации о соискателе из резюме и произвести ввод этих данных в корпоративную систему.

Информационная безопасность

Проводить расследования используя быстрый анализ переписки, документов.

Ввод неструктурированных данных в различные информационные системы организации (СЭД/ECM, ERP и др.)

Возможно точно извлекать данные из неструктурированной части документа и вводить их в целевую систему предприятия, благодаря этому организации могут сократить время сотрудников на ручной ввод данных и уменьшить количество ошибок, связанных с человеческим фактором.

Формирование аналитических отчетов

Анализ значимой информации из внутренних документов организации (приказы, отчеты, общая распорядительная документация и др.) для формирования сводных аналитических отчетов и поддержки процесса принятий решений в организации. ABBYY InfoExtractor SDK позволяет автоматически извлекать значимые для организации факты, приводить информацию из отчетов, приказов и других документов в структурированный вид для создания на их основе аналитических отчетов.

Распределение платежей по статьям выплат

Автоматическое извлечение необходимых данных из неструктурированных полей платежных документов оптимизирует задачи, которые зачастую выполняются вручную бухгалтерами компании. Это позволяет повысить эффективность процесса, упростить финансовый аудит и улучшить прогнозирование.

Решение ABBYY и BAUM для надежного хранения и глубокого анализа данных позволяет заставить Вашу информацию работать на Вас.