Скачать KnoDL Free

Бесплатная CLI-версия KnoDL для тестирования алгоритма дедупликации и matching на ваших данных.

Docker-образ KnoDL Free

Быстрый старт (5 минут)

Шаг 1: Установите Docker

Если у вас ещё нет Docker:

Шаг 2: Скачайте образ KnoDL

docker pull knodlang/kdlfree:kdl

Шаг 3: Запустите контейнер

Перейдите в директорию с вашими CSV-файлами:

cd /path/to/your/data
docker run --rm -ti -v "$(pwd)":/opt/data knodlang/kdlfree:kdl

Вы попадёте в CLI KnoDL, ваши файлы будут видны в /opt/data.

Работа с данными

0. Подготовка CSV

Ваш CSV должен:

  • Иметь заголовки в первой строке
  • Быть в кодировке UTF-8
  • НЕ содержать переносов строк внутри полей

Подготовка файла:

s0_prepare_csv.sh

Скрипт попросит указать файл и устранит типичные проблемы CSV.

Если есть переносы строк внутри полей:

mlr --csv gsub -a '\n' ' ' "input.csv" > "output.csv"

1. Импорт данных

s1_import.sh

Скрипт загрузит CSV во внутреннее хранилище KnoDL и запомнит номер справочника.

2. Дедупликация

s2_dedup.sh
  1. Попросит выбрать справочник
  2. Произведёт дедупликацию
  3. Покажет найденные дубли
  4. Позволит задать порог отсечки (weight)

3. Fuzzy Matching

Сопоставление записей из двух разных справочников:

s3_match.sh

Для каждой записи из справочника A найдёт наиболее похожую из справочника B.

4. Экспорт результатов

s9_export.sh

Экспортирует результаты в CSV.

Пример: Дедупликация товарного каталога

Шаг 1 (до дедупликации):

1. iPhone 13 Pro
2. iPhone 13Pro
3. Samsung Galaxy S21
4. Samsung Galaxy S 21
5. MacBook Pro 16

Шаг 2 (KnoDL отметил дубли):

1. iPhone 13 Pro
2. iPhone 13Pro        ← дубль с #1
3. Samsung Galaxy S21
4. Samsung Galaxy S 21 ← дубль с #3
5. MacBook Pro 16

Шаг 3 (после дедупликации):

1. iPhone 13 Pro
3. Samsung Galaxy S21
5. MacBook Pro 16

Дубли удалены: позиции 2 и 4.

Доступные скрипты

Скрипт Описание
s0_prepare_csv.sh Подготовка CSV к импорту
s1_import.sh Импорт данных в KnoDL
s2_dedup.sh Дедупликация справочника
s3_match.sh Fuzzy matching двух справочников
s9_export.sh Экспорт результатов в CSV
sh_select_dict.sh Выбор справочника для работы
sh_weight_cut.sh Настройка порога отсечки

Ограничения Free версии

Параметр KnoDL Free (CLI) KnoDL Commercial
Интерфейс Командная строка (CLI) REST API + UI
Объём данных До 100K записей Без ограничений
Интеграция Ручной экспорт/импорт CSV API для автоматизации
Поддержка Community (GitHub issues) SLA, email, phone
Production use Запрещено лицензией Разрешено
Цена $0 От $50K/год

FAQ

Можно ли использовать Free версию в production?

Нет. Free версия лицензирована только для:

  • Тестирования алгоритма
  • Proof-of-concept
  • Обучения команды
  • Разработки (dev/test окружения)

Для production использования нужна коммерческая лицензия.

В чём главное отличие Free от Commercial?

Free:

  • CLI (командная строка)
  • Ручная работа с CSV
  • Для proof-of-concept

Commercial:

  • REST API для интеграции
  • Автоматизация через API
  • Для production систем
  • Поддержка и SLA
Как перейти с Free на Commercial?
  1. Протестируйте алгоритм на Free версии
  2. Оцените точность на вашем sample данных
  3. Запросите коммерческий пилот
  4. Мы поможем с интеграцией через API

Готовы к production?

Если Free версия показала хорошую точность и вы готовы к интеграции в ваши системы - запросите коммерческий пилот.

Что включено:

  • REST API для интеграции
  • Пилот от 2 недель на ваших данных
  • Отчёт по точности и рекомендации
  • Помощь с интеграцией в MDM/ERP/MES
  • Обучение команды

Дополнительные материалы

Docker Hub: hub.docker.com/r/knodlang/kdlfree

Размер образа: 219 MB

Последнее обновление: ~1 месяц назад