diff --git a/README.md b/README.md index c943f13..c59d575 100644 --- a/README.md +++ b/README.md @@ -105,7 +105,7 @@ hamori/ ├── README.md этот файл ├── requirements.txt зависимости Python ├── docs/ -│ ├── chord_format_spec.md спецификация формата .chord (версия 2.0) +│ ├── chord_format_spec.md спецификация формата .chord (версия 2.2) │ ├── requirements.md функциональные и нефункциональные требования │ ├── architecture.md архитектура системы │ └── glossary.md глоссарий терминов @@ -141,7 +141,7 @@ python scripts/generate.py \ --checkpoint checkpoints/finetuned.pt \ --mode major \ --key F# \ - --style user \ + --style H1K0 \ --function chorus \ --time 4/4 \ --output reports/samples/period.chord \ @@ -188,7 +188,7 @@ python scripts/generate.py \ замкнутости — возврат к тонике или ясная полукаденция, отсутствие модуляции внутри фрагмента. 2. Заполнить шапку `.chord`-файла: название, тональность, тактовый размер, - подразделение доли, стилевой тег `user`, функциональная роль периода. + подразделение доли, стилевой тег `H1K0`, функциональная роль периода. 3. Транскрибировать гармонию по позициям, аккуратно фиксируя инверсии и расширения. 4. Запустить парсер для проверки корректности файла: ```bash diff --git a/docs/architecture.md b/docs/architecture.md index e2d59a3..4212780 100644 --- a/docs/architecture.md +++ b/docs/architecture.md @@ -240,7 +240,7 @@ Python и опционально `music21` (как fallback для нетипи **Публичный интерфейс.** - Константа `VOCAB: list[str]` — словарь токенов в порядке, описанном в - спецификации формата (81 токен). + спецификации формата (85 токенов). - Константа `TOKEN_TO_ID: dict[str, int]` — обратное отображение. - Функция `parse_chord_file(path: Path) -> ChordPeriod` — парсинг `.chord`-файла в структурированное представление. @@ -478,7 +478,7 @@ key, prefix=None, temperature=1.0, top_p=0.9, max_tokens=300, seed=None) | Число голов внимания | 6 | | Размерность FFN | 768 | | Длина контекста | 512 токенов | -| Размер словаря | 81 | +| Размер словаря | 85 | | Dropout | 0.1 | При необходимости конфигурация может быть пересмотрена в сторону уменьшения @@ -719,7 +719,7 @@ C major, минорные — в A minor. Тональность в словар на несколько токенов (корень, качество, расширение, бас). **Решение.** Каждый аккорд представляется ровно четырьмя токенами: -`ROOT_x`, `QUAL_x`, `EXT_x`, `BASS_x`. Словарь содержит 81 токен против +`ROOT_x`, `QUAL_x`, `EXT_x`, `BASS_x`. Словарь содержит 85 токенов против нескольких сотен в случае атомарной токенизации. **Последствия.** diff --git a/docs/requirements.md b/docs/requirements.md index 09e2912..4007fa9 100644 --- a/docs/requirements.md +++ b/docs/requirements.md @@ -110,7 +110,7 @@ GPU-ресурсов (Google Colab) допустимо, но не должно ### 3.1 Подсистема работы с форматом данных **ФТ-1.** Система должна поддерживать чтение `.chord`-файлов в формате, -описанном в `docs/chord_format_spec.md` версии 2.0, включая: +описанном в `docs/chord_format_spec.md` версии 2.2, включая: - Парсинг шапки с метаданными. - Парсинг тела файла, состоящего из последовательности тактов. @@ -136,7 +136,7 @@ GPU-ресурсов (Google Colab) допустимо, но не должно **ФТ-4.** Система должна выполнять токенизацию `.chord`-файлов в последовательности целочисленных идентификаторов согласно словарю, -описанному в §5 спецификации формата. Словарь содержит 81 токен. +описанному в §5 спецификации формата. Словарь содержит 85 токенов. **ФТ-5.** Система должна поддерживать обратную детокенизацию: преобразование последовательности целочисленных идентификаторов обратно в `.chord`-файл,