Технологии: Python, NLP, Машинное обучение
Продолжительность: 3 месяца
Наш клиент создает финансовое программное обеспечение (под названием «CF Engine») для моделирования сложных финансовых продуктов (RMBS, ABS, CLO и т. д.). Основная цель проекта — расширить это программное обеспечение, используя функцию, которая позволяет пользователям просматривать соответствующие юридические документы на основе информации из модели. Разработанная модель должна проверять, соответствует ли конкретный документ одной из созданных моделей.
Например, если обрабатываемый документ является закладной, тогда модель:
- parses mortgage document (from PDF, Word, plain text format);
- checks if document contains all required information (all parties are specified and described correctly, property is described, interest rate is specified, all information required by law is provided and so on);
- if document fits the model then system extracts important information (parties, property description, interest rates and so on) and provides it as summary for user review.
Система поддерживает разные форматы входных документов и разные типы документов, такие как ипотека, автокредит, коммерческий кредит и так далее. Также система поддерживает разные страны работы, т.е. разную структуру документов для каждой страны и разные языки.