mirror of
https://github.com/NomaDamas/k-skill.git
synced 2026-06-24 02:04:11 +00:00
Keep arbitrary text links, email addresses, and code spans usable while preserving the deterministic middle-korean-style-v1 prose transform.\n\nConstraint: PR #281 round 3 requested URL/email/code-like span protection after broad global replacement probes rewrote structural tokens.\nRejected: Narrowing all lexicon and particle rules with word-boundary heuristics | would change established v1 creative broad-replacement behavior beyond the reviewed issue.\nConfidence: high\nScope-risk: narrow\nDirective: Protect new structural span classes before broad replacements and add regression tests before extending the protected surface.\nTested: node --test scripts/test_korean_middle_korean.js; node --check korean-middle-korean/scripts/korean_middle_korean.js; node --check scripts/korean_middle_korean.js; CLI URL/email/code/Markdown probes; installed-skill smoke via ~/.agents/skills/korean-middle-korean/scripts/korean_middle_korean.js; npm run lint; npm run typecheck; root/workspace test chain without pip bootstrap; npm run pack:dry-run; post-deslop npm run lint && npm run typecheck && node --test scripts/test_korean_middle_korean.js && npm run pack:dry-run\nNot-tested: direct npm run test remains blocked before repo tests by local Homebrew Python 3.14 pyexpat/libexpat import error.
3.4 KiB
3.4 KiB
한국 중세 국어풍 변환 가이드
이 기능으로 할 수 있는 일
- 한국어 입력문을 창작용 중세국어풍 문체로 변환
은/는,을/를,에서같은 일부 조사를ᄋᆞᆫ,ᄋᆞᆯ,애처럼 변환했다,하는,말하는같은 일부 어미를ᄒᆞ엿다〮,ᄒᆞᄂᆞᆫ,ᄆᆞᆯᄒᆞᄂᆞᆫ처럼 변환- 날짜 단위를
年,月,日로 변환 - 일부 한자어를
熱愛說,俳優,學校처럼 Hanja 힌트로 변환 - URL, 이메일, Markdown 링크, inline/fenced code span은 구조 토큰으로 보고 변환하지 않음
- 인명·숫자·고유명사는 완전 보존이 아니라, 규칙이 맞지 않을 때 원문을 남기는 best-effort 방식으로 처리
왜 별도 스킬이 필요한가
LLM에게 "중세 국어처럼"이라고만 요청하면 변환 강도와 표기가 매번 달라진다. 이 스킬은 밈/창작용 변환에서 필요한 최소 계약을 고정한다.
- 동일 입력은 동일 출력으로 변환한다.
- 어떤 규칙이 적용됐는지
replacements배열로 확인할 수 있다. - 학술적 복원이 아니라 스타일 변환임을 문서화한다.
기본 계약
프로필은 middle-korean-style-v1이다.
- 날짜 단위 정규화를 먼저 적용한다.
2015년 7월 21일은2015年 7月 21日처럼 바뀐다. - 그다음 결정론적 lexicon 치환을 적용한다.
- 일부 현대 조사를 중세국어풍 조사로 바꾼다.
- 일부 현대 어미를
ᄒᆞ-계열 중세국어풍 어미로 바꾼다. - URL, 이메일, Markdown 링크, inline/fenced code span은 먼저 보호한 뒤 마지막에 원문 그대로 복원한다.
- 한자어 힌트는 넓은 전역 치환으로 적용되므로 합성어·고유명사처럼 보이는 문자열 안에서도 바뀔 수 있다.
- 변환하지 못한 내용은 원문 의미 보존을 위해 그대로 둔다.
middle-korean-style-v1의 출력 변경은 호환성에 영향을 주는 계약 변경으로 본다. 새 규칙을 추가하거나 순서를 바꿀 때는 회귀 테스트와 문서 예시를 함께 갱신한다.
CLI 사용 예시
기본 JSON 출력
node scripts/korean_middle_korean.js --text "민수는 3월 5일 학교에서 공부했다."
예상 출력 일부:
{
"profile": "middle-korean-style-v1",
"input": "민수는 3월 5일 학교에서 공부했다.",
"output": "민수ᄋᆞᆫ 3月 5日 學校애 공부ᄒᆞ엿다〮.",
"replacements": [
{ "kind": "date", "from": "월→月", "to": "$1月", "count": 1 }
]
}
변환문만 출력
node scripts/korean_middle_korean.js --text "열애설을 인정했다." --format text
예상 출력:
熱愛說ᄋᆞᆯ 인졍ᄒᆞ엿다〮.
파일/stdin 입력
node scripts/korean_middle_korean.js --file ./input.txt --format text
cat input.txt | node scripts/korean_middle_korean.js --stdin --format json
응답 원칙
- 결과는
output필드를 중심으로 전달한다. - "정확한 중세국어 번역"이 아니라 "중세국어풍/창작용 변환"이라고 설명한다.
- 사용자가 학술적 정확성을 요구하면 이 스킬의 한계를 먼저 알리고, 전문 고문헌 검토가 필요하다고 안내한다.
검증
node --test scripts/test_korean_middle_korean.js
node scripts/korean_middle_korean.js --text "민수는 3월 5일 학교에서 공부했다." --format text