docs: actualize vocab size (81→85), spec version (2.0→2.2), style tag (user→H1K0)
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -105,7 +105,7 @@ hamori/
|
|||||||
├── README.md этот файл
|
├── README.md этот файл
|
||||||
├── requirements.txt зависимости Python
|
├── requirements.txt зависимости Python
|
||||||
├── docs/
|
├── docs/
|
||||||
│ ├── chord_format_spec.md спецификация формата .chord (версия 2.0)
|
│ ├── chord_format_spec.md спецификация формата .chord (версия 2.2)
|
||||||
│ ├── requirements.md функциональные и нефункциональные требования
|
│ ├── requirements.md функциональные и нефункциональные требования
|
||||||
│ ├── architecture.md архитектура системы
|
│ ├── architecture.md архитектура системы
|
||||||
│ └── glossary.md глоссарий терминов
|
│ └── glossary.md глоссарий терминов
|
||||||
@@ -141,7 +141,7 @@ python scripts/generate.py \
|
|||||||
--checkpoint checkpoints/finetuned.pt \
|
--checkpoint checkpoints/finetuned.pt \
|
||||||
--mode major \
|
--mode major \
|
||||||
--key F# \
|
--key F# \
|
||||||
--style user \
|
--style H1K0 \
|
||||||
--function chorus \
|
--function chorus \
|
||||||
--time 4/4 \
|
--time 4/4 \
|
||||||
--output reports/samples/period.chord \
|
--output reports/samples/period.chord \
|
||||||
@@ -188,7 +188,7 @@ python scripts/generate.py \
|
|||||||
замкнутости — возврат к тонике или ясная полукаденция, отсутствие модуляции
|
замкнутости — возврат к тонике или ясная полукаденция, отсутствие модуляции
|
||||||
внутри фрагмента.
|
внутри фрагмента.
|
||||||
2. Заполнить шапку `.chord`-файла: название, тональность, тактовый размер,
|
2. Заполнить шапку `.chord`-файла: название, тональность, тактовый размер,
|
||||||
подразделение доли, стилевой тег `user`, функциональная роль периода.
|
подразделение доли, стилевой тег `H1K0`, функциональная роль периода.
|
||||||
3. Транскрибировать гармонию по позициям, аккуратно фиксируя инверсии и расширения.
|
3. Транскрибировать гармонию по позициям, аккуратно фиксируя инверсии и расширения.
|
||||||
4. Запустить парсер для проверки корректности файла:
|
4. Запустить парсер для проверки корректности файла:
|
||||||
```bash
|
```bash
|
||||||
|
|||||||
@@ -240,7 +240,7 @@ Python и опционально `music21` (как fallback для нетипи
|
|||||||
**Публичный интерфейс.**
|
**Публичный интерфейс.**
|
||||||
|
|
||||||
- Константа `VOCAB: list[str]` — словарь токенов в порядке, описанном в
|
- Константа `VOCAB: list[str]` — словарь токенов в порядке, описанном в
|
||||||
спецификации формата (81 токен).
|
спецификации формата (85 токенов).
|
||||||
- Константа `TOKEN_TO_ID: dict[str, int]` — обратное отображение.
|
- Константа `TOKEN_TO_ID: dict[str, int]` — обратное отображение.
|
||||||
- Функция `parse_chord_file(path: Path) -> ChordPeriod` — парсинг
|
- Функция `parse_chord_file(path: Path) -> ChordPeriod` — парсинг
|
||||||
`.chord`-файла в структурированное представление.
|
`.chord`-файла в структурированное представление.
|
||||||
@@ -478,7 +478,7 @@ key, prefix=None, temperature=1.0, top_p=0.9, max_tokens=300, seed=None)
|
|||||||
| Число голов внимания | 6 |
|
| Число голов внимания | 6 |
|
||||||
| Размерность FFN | 768 |
|
| Размерность FFN | 768 |
|
||||||
| Длина контекста | 512 токенов |
|
| Длина контекста | 512 токенов |
|
||||||
| Размер словаря | 81 |
|
| Размер словаря | 85 |
|
||||||
| Dropout | 0.1 |
|
| Dropout | 0.1 |
|
||||||
|
|
||||||
При необходимости конфигурация может быть пересмотрена в сторону уменьшения
|
При необходимости конфигурация может быть пересмотрена в сторону уменьшения
|
||||||
@@ -719,7 +719,7 @@ C major, минорные — в A minor. Тональность в словар
|
|||||||
на несколько токенов (корень, качество, расширение, бас).
|
на несколько токенов (корень, качество, расширение, бас).
|
||||||
|
|
||||||
**Решение.** Каждый аккорд представляется ровно четырьмя токенами:
|
**Решение.** Каждый аккорд представляется ровно четырьмя токенами:
|
||||||
`ROOT_x`, `QUAL_x`, `EXT_x`, `BASS_x`. Словарь содержит 81 токен против
|
`ROOT_x`, `QUAL_x`, `EXT_x`, `BASS_x`. Словарь содержит 85 токенов против
|
||||||
нескольких сотен в случае атомарной токенизации.
|
нескольких сотен в случае атомарной токенизации.
|
||||||
|
|
||||||
**Последствия.**
|
**Последствия.**
|
||||||
|
|||||||
@@ -110,7 +110,7 @@ GPU-ресурсов (Google Colab) допустимо, но не должно
|
|||||||
### 3.1 Подсистема работы с форматом данных
|
### 3.1 Подсистема работы с форматом данных
|
||||||
|
|
||||||
**ФТ-1.** Система должна поддерживать чтение `.chord`-файлов в формате,
|
**ФТ-1.** Система должна поддерживать чтение `.chord`-файлов в формате,
|
||||||
описанном в `docs/chord_format_spec.md` версии 2.0, включая:
|
описанном в `docs/chord_format_spec.md` версии 2.2, включая:
|
||||||
|
|
||||||
- Парсинг шапки с метаданными.
|
- Парсинг шапки с метаданными.
|
||||||
- Парсинг тела файла, состоящего из последовательности тактов.
|
- Парсинг тела файла, состоящего из последовательности тактов.
|
||||||
@@ -136,7 +136,7 @@ GPU-ресурсов (Google Colab) допустимо, но не должно
|
|||||||
|
|
||||||
**ФТ-4.** Система должна выполнять токенизацию `.chord`-файлов в
|
**ФТ-4.** Система должна выполнять токенизацию `.chord`-файлов в
|
||||||
последовательности целочисленных идентификаторов согласно словарю,
|
последовательности целочисленных идентификаторов согласно словарю,
|
||||||
описанному в §5 спецификации формата. Словарь содержит 81 токен.
|
описанному в §5 спецификации формата. Словарь содержит 85 токенов.
|
||||||
|
|
||||||
**ФТ-5.** Система должна поддерживать обратную детокенизацию: преобразование
|
**ФТ-5.** Система должна поддерживать обратную детокенизацию: преобразование
|
||||||
последовательности целочисленных идентификаторов обратно в `.chord`-файл,
|
последовательности целочисленных идентификаторов обратно в `.chord`-файл,
|
||||||
|
|||||||
Reference in New Issue
Block a user