Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

Releases: epoko77-ai/im-not-ai

v2.0.0 — 한국 번역학계 8유형 + post-editese metric (A-17 hold)

07 May 14:11
@epoko77-ai epoko77-ai
67b14e7
This commit was created on GitHub.com and signed with GitHub’s verified signature.
GPG key ID: B5690EEEBB952194
Verified
Learn about vigilant mode.

Choose a tag to compare

im-not-ai — 한글 AI 티 제거기 v2.0

한국 번역학자의 책상에서 가져온 분류 체계 — 영-한 번역학계 8유형 + post-editese 정량 트랙. monolith·5인 정의 무수정.

v2.0.0 (2026年05月07日)

한국 번역학계 8대 번역투 유형(이근희·김정우·김도훈·곽은주·김순영·박옥수·김혜영·이영옥) + Toral 2019 post-editese 3축 통합. monolith·5인 정의 무수정, 도구 호출 3회 캡(v1.6.1) 보존.

신규 4건 (본진 등재)

  • A-16 영어 대명사 직역 [S1]
  • A-18 관계대명사절 좌향 수식 [S2]
  • A-19 이중 조사 결합 [S2]
  • E-7 청자 경어법 일관성 손실 [S2 estimated, dialogue 가드]

Hold 1건 (v2.0b — NMT 원본 회차 후 v2.1 부활 대기)

  • A-17 무정물·추상명사 '-들' — v1.6 5편 + 외부 회차 위키 6편 양성 0건. 학술 anchor·metric·scholarship.md §4 보존, ID 슬롯 비워둠.

보강 4건

  • A-15 사역·인지 동사 분리 / A-7 light verb construction 일반화 / F-4 영어 명사화 4종 통합 / E-2 진행형 자동 매핑

post-editese 14 metric (metric-only 트랙, caveat C3)

simplification 3 + normalisation 2 + interference 8 + interference_index 합성 = 14. 본진 패턴 ID 미부여, baseline_v2.json 70셀 placeholder.

회귀 검증

  • v1.6 5편 점수 산출 (재윤문 없음): 회귀 0건, lexical_diversity 5편 전수 상승.
  • 외부 회차 위키 6편: A-16 양성 50%·A-18 양성 67%, interference_index 외부 0.251 vs v1.6 0.05~0.10 (Toral 가설 1차 부합).

호환성

  • 슬래시 커맨드 무변경. monolith 헤더 +0.6KB. patternID 안정성 ✓.

PR: #19

Assets 2
Loading
boakim-dev, GhostGN95, leeyangsoo, hataeheung, leelle0117, snowyell82, HyunjunJeon, yscha-nxt, and hs85-newbie reacted with thumbs up emoji
9 people reacted

v1.6.1 — final.md 통합 산출물 hotfix

06 May 15:53
@epoko77-ai epoko77-ai
6138697
This commit was created on GitHub.com and signed with GitHub’s verified signature.
GPG key ID: B5690EEEBB952194
Verified
Learn about vigilant mode.

Choose a tag to compare

Hotfix

v1.6 회귀에서 sub-agent의 두 번째 Write(summary.md)가 5/5 차단되는 패턴이 확인됐습니다(권한 X, self-imposed). monolith 산출물을 final.md 1개로 통합하여 회피했습니다.

변경

  • humanize-monolith.md만 수술 — 산출물 = final.md 1개, 본문 끝 <!-- HUMANIZE-SUMMARY ... --> HTML 주석 블록 1개로 메트릭·카테고리 탐지(before → after)·자체검증 6항·등급·하이라이트·잔존 finding 통합
  • 도구 호출 캡 4회 → 3회 (Read 입력 + Read 룰북 + Write final)
  • HTML 주석이라 마크다운 뷰어·웹 게시·복사 시 본문에만 노출. 메타 추출은 grep -A 30 "HUMANIZE-SUMMARY"

무수정 보존

  • 5인 strict 파이프라인 정의
  • references/metrics.py · baseline.json · scripts/prepare_monolith_input.py · tests/test_metrics.py
  • ai-tell-taxonomy.md v1.6 · quick-rules.md v1.6

관련

Loading

v1.6.0 — KatFish·LREAD 기반 분류 체계 보강 + 정량 점수 레이어

06 May 15:33
@epoko77-ai epoko77-ai
43094bf
This commit was created on GitHub.com and signed with GitHub’s verified signature.
GPG key ID: B5690EEEBB952194
Verified
Learn about vigilant mode.

Choose a tag to compare

핵심 변경

분류 체계 v1.5.1 → v1.6

  • 신규 5건: C-11 연결어미 뒤 쉼표 [S1, KatFish 4.84배 단일 최강 분리도] · C-12 쉼표 포함률 [S2] · E-5 분절 평균 길이 [S2] · E-6 POS 다양성 [S2, 에세이·뉴스 한정] · G-3 안전 균형 lexicon [S2]
  • 보강 2건: D-1 결산 lexicon 4종 정식 인용 / F-4 한자어 명사화 -성·-적·-화 명시 + 12회 임계
  • hold 2건: BN/VX 띄어쓰기 규칙성·페르소나-레지스터 불일치 (v1.7+ 검토)

룰북 보강 (monolith 무수정)

  • quick-rules.md 123 → 126줄: C-11·G-3·F-4·D-1 lexicon 처방 추가
  • humanize-monolith.md·5인 에이전트 정의 모두 무수정 — v1.5 도구 호출 4회 캡 그대로 보존

정량 점수 레이어 신설

  • references/metrics.py (308줄) — 8지표 계산기, 표준 라이브러리만 (konlpy·bareun 의존성 0)
  • references/baseline.json — KatFish 3장르 baseline + 3종 lexicon + LREAD 캘리브레이션
  • scripts/prepare_monolith_input.py — monolith 호출 외부 사전처리, 결합 입력 파일에 점수 prepend
  • tests/test_metrics.py — 13 케이스 전수 통과

검증 결과 (run 003~007 5편 일괄, 같은 입력에 v1.5 vs v1.6 두 번 윤문)

지표 v1.5 v1.6 개선
ending_comma 평균 z +3.40 +0.67 −2.73 (인간 baseline 근접)
risk_band low 도달 0/5 3/5 +3
input 대비 risk_score 감소 2/5 4/5 +2
등급 A 유지 5/5 5/5 회귀 없음
도구 호출 4회 캡 5/5 5/5 보존

가장 심한 케이스(run 006 교육 블로그)는 ending_comma_rate 0.500 → 0.120(76% 감소), z=+5.84 → +1.00로 정상 구간 도달. v1.5 회귀에서 5편 중 4편이 악화했던 자리에서 v1.6은 5편 전수 개선.

한계 — 다음 회차 과제

  • baseline의 lexical_diversity·hanja_nominalizer_density placeholder는 KatFish 미공개 셀로 보수적 추정값 → 한국어 essay 실측 교정 필요
  • 정책·공적 문서(run 007)는 ending_comma z=+2.47 잔존 → 장르별 baseline 별도 카탈로그 필요
  • 일부 케이스에서 char_count 증가(쉼표 제거 부작용으로 분절 길이 늘어남) → 룰북에 분절 재조정 가이드 검토

관련

  • PR: #17 (#17)
  • 산출물: _workspace/v1.6-2026年05月06日/01_pattern_candidates.md ~ 05_regression_report.md
Loading
yungblud reacted with thumbs up emoji
1 person reacted

v1.5.0 — v1.1 베이스라인 + Monolith Fast Path

26 Apr 04:24
@epoko77-ai epoko77-ai
66f8399
This commit was created on GitHub.com and signed with GitHub’s verified signature.
GPG key ID: B5690EEEBB952194
Verified
Learn about vigilant mode.

Choose a tag to compare

핵심 변경

v1.2(voice profile) · v1.3(candidate pool) · v1.4(역할별 모델 분산)이 모두 핫패스 비용을 잡지 못한 게 검증됐습니다. 5,000자 입력 윤문 wall-clock이 25분에 달했고, v1.4의 모델 다운그레이드만으로는 detector 1콜이 여전히 8분이었습니다.

진범은 모델이 아니라 에이전트 간 컨텍스트 재로드 + 에이전트 내부 도구 호출 chain 누적이었습니다. v1.5는 이를 정면 대응합니다.

1. v1.2~v1.4 폐기 (롤백)

  • 5인 에이전트 정의를 v1.1 commit f25ee64 시점으로 복원
  • voice profile · candidate pool · 권한 위계 절 모두 제거
  • reference 4개 파일 삭제 (author-context-schema.md · pattern-candidates.md · promotion-checklist.md · sample-collection.md)

2. Monolith Fast Path 신설 (디폴트)

  • humanize-monolith 에이전트(opus): 한 콜 안에서 탐지·윤문·자체검증 일괄 처리
  • 도구 호출 4~5회 캡 (Read 입력 + Read 룰북 + Write final + Write summary)
  • quick-rules.md(150줄): 본진 386줄에서 S1·S2 핵심 패턴만 추린 슬림 룰북

3. Strict 모드 보존 (--strict 또는 자동 승급)

  • v1.1 5인 파이프라인을 strict 백본으로 유지
  • 8,000자+ 입력은 자동 승급
  • 부분 재실행("이 카테고리만 다시"·"2차 윤문")도 strict로 자동 전환

4. 분류 체계 본진 유지

  • ai-tell-taxonomy.md의 v1.2~v1.3.1 발굴 신규 패턴(C-9·C-10·D-7·H-3·I-3·I-4 보강 등) 모두 보존
  • voice profile 종속 절(권한 위계 §1~§6)만 제거

검증 결과 (같은 칼럼 2,604자)

항목 v1.4 (detector haiku 1콜) v1.5 (monolith opus 1콜)
Wall-clock 7분 58초 3분 28초
도구 호출 12회 4회
토큰 113,621 68,045
윤문 등급 (단계 1만 끝, 미완) A (자체검증 6/6, 변경률 22%)

5인 파이프라인 25분 → monolith 3.5분, 약 86% 단축. opus로 모델 격상하고도 도구 호출 chain을 압축한 게 결정적.

호환성 안내

  • v1.3.1 사용자: voice profile YAML이 더 이상 작동하지 않습니다. 사용자 메모리상 voice profile은 실전 사용 사례 미확보였고, 필요 시 v1.6에서 monolith의 가벼운 옵션으로 재도입을 검토합니다.
  • 슬래시 커맨드 /humanize · /humanize-redo는 그대로. 내부에서 v1.5 fast/strict 분기 자동.

관련 PR

  • #13 — v1.5 본 PR

회고

  • v1.4 작업은 모델 다운그레이드를 진단의 1순위로 잡았으나, 실측 데이터(detector haiku 1콜 8분)로 진단이 틀렸음이 확인됐습니다. v1.5는 같은 칼럼으로 회귀 검증한 데이터 위에 발행됐습니다.
Loading

v1.3.1 hotfix — 회차 3 Gemini 직접 호출 + 본진 신규 2건·보강 3건

25 Apr 11:57
@epoko77-ai epoko77-ai
e6dd130
This commit was created on GitHub.com and signed with GitHub’s verified signature.
GPG key ID: B5690EEEBB952194
Verified
Learn about vigilant mode.

Choose a tag to compare

v1.3 발행 직후, 사용자께서 직접 Gemini API 키를 제공해 회차 3 진짜 외부 데이터 검증을 진행한 결과를 hotfix patch로 반영합니다. v1.x 발행 정책의 "외부 의존 데이터 도착 시 hotfix patch" 패턴 준수.

본진 신규 2건 (Gemini-우세 시그니처)

  • C-10 콜론 부제 헤딩 공식 "X: Y" 또는 "X: A에서 B로" — 8회·3파일·3도메인
  • D-7 변환 공식 "X에서 Y로 / X을 넘어 Y로" — 7회·2파일·2도메인

본진 보강 3건

  • D-4 Gemini hype 어휘 셋 추가 (압도적·막강한·폭발적·파격적·대대적·강력한)
  • J-2 빈도 임계 명시 (한 문서 따옴표 5회 초과 시 S2 강화)
  • I-4 권고형 결말 변종 추가 (~해야 한다·~해야 합니다)

회차 2 hold 후보 검증 — GPT vs Gemini 모델 차이 발견

회차 2 hold GPT Gemini
"결국" 문두 9+ 1
"A 아니라 B" 7+ 2
5+ 콤마 나열 4 0

회차 2 hold 후보 3건이 Gemini에서 거의 재현되지 않은 사실은 분류 체계에 "모델 우세 분포" 메타데이터 도입 필요성을 시사합니다(v1.4 검토). hold 3건 모두 status_reason 갱신해 hold 유지.

회차 1·2·3 누적

회차 데이터 본진 신규 본진 보강
1 Claude 합성 2건 C-9 I-2
2 뉴스핌 GPT 2건 0 I-3·H-3
3 Gemini 직접 4건 C-10·D-7 D-4·J-2·I-4
합계 8건 3건 6건

v1.2 신규 0건 정체기를 v1.3 인프라 + 외부 모델 데이터 3종으로 깬 결과.

데이터 보존

회차 3 Gemini 호출 스크립트(자연 prompt 4종)·출력 본문·manifest는 `_workspace/v1.3-pilot/round3-gemini/`에 로컬 보존(gitignored). 분석 노트는 `04_round3_gemini-analysis.md`.

하위 호환성

v1.3.1은 v1.3과 하위 호환. 운영 인프라 변경 없음, voice profile 동작 동일. 본진 신규 2건·보강 3건은 다음 humanize-korean run부터 자동 적용.

PR

#10 — v1.3 → v1.3.1 hotfix 단일 commit

Loading

v1.3 — 서브 패턴 발굴 운영 체계 + 본진 신규 1건·보강 3건

25 Apr 11:26
@epoko77-ai epoko77-ai
3be2026
This commit was created on GitHub.com and signed with GitHub’s verified signature.
GPG key ID: B5690EEEBB952194
Verified
Learn about vigilant mode.

Choose a tag to compare

분류 체계의 본진 패턴은 그대로 유지하면서, 에이전트들이 실전에서 만난 미분류 의심 패턴을 단일 풀에 누적·점검·승격하는 운영 인프라를 도입합니다. v1.1까지의 패턴 추가가 사람의 1회성 결정이었고 v1.2에서 voice profile 권한 위계가 들어왔다면, v1.3은 분류 체계 자체가 시간을 따라 자라나는 구조입니다.

발행 전 두 회차의 파일럿(회차 1 합성 샘플 인프라 검증 + 회차 2 외부 매체 진짜 GPT 출력 분석)에서 본진 신규 1건과 보강 3건을 동시에 영구 반영했습니다.

운영 인프라 5종

  • references/pattern-candidates.md — 본진 승격 전 모든 의심 패턴을 누적하는 단일 그릇
  • 3개 에이전트 풀 적재 채널 — detector·rewriter·naturalness-reviewer가 미분류 패턴을 풀에 직접 적재
  • taxonomist 풀 운영자 역할 — 4가지 trigger 기반 정기 점검, 6단계 절차
  • references/sample-collection.md — 4축 다양성 매트릭스, 4종 채널, 익명화·저작권 5대 정책
  • references/promotion-checklist.md — 6게이트 정량 판정 표준

누적 결과

항목 회차 1 회차 2 합계
본진 신규 C-9 (숫자 괄호 인덱싱) 0 1건
본진 보강 I-2 (결합형) I-3 (결말 변종) · H-3 (메타 진입 변종) 3건
풀 hold 누적 1건 3건 (강력 후보) 4건

회차 2 핵심 발견

뉴스핌 [AI로 읽는 경제] 시리즈(ChatGPT 작성 명시) 분석에서 Gate 1.3 분산 보호장치가 진짜 외부 데이터에서도 정확히 작동한 것이 가장 큰 결과입니다. 9회+ 등장한 "결국" 문두 단언, 7회+ 등장한 "X은 A가 아니라 B다" 부정-긍정 대구 결산이 occurrences·source distinct는 모두 통과했지만 같은 모델·같은 기자 시리즈라는 정성 분산 검사로 hold 처리됐습니다. 단일 출처 노이즈가 본진을 오염시키지 않으면서 다음 회차에 다른 모델 데이터에서 재현되면 즉시 promoted 가능한 강력 후보로 풀에 누적됐습니다. v1.2 워크플로였다면 이 정보는 모두 묻혔을 것입니다.

보너스 발견

본진 H-1 명시 어휘("또한·따라서·즉·나아가·아울러·게다가·더욱이")가 한국 매체 GPT 출력에서 적게 나오고, 본진 미수록 "결국·다시 말해·특히"가 압도적으로 많다는 분포 미스매치 발견. 향후 H-1 어휘 셋의 재캘리브레이션 신호.

하위 호환성

v1.3은 v1.2와 하위 호환입니다. 에이전트 입출력 변경 없음, voice profile 동작 동일. 풀 적재는 부수 효과이며 적재 실패가 메인 파이프라인을 막지 않습니다.

회차 3 권장 입력 (v1.3.1 hotfix 트리거)

회차 2 데이터 확보의 정직한 한계: Gemini가 작성한 한국 매체 칼럼 본문은 검색에서 직접 인용 텍스트로 확보하지 못했습니다. 회차 3는 다음 데이터 우선 확보 — Gemini Pro 2.5 / HyperCLOVA X·Solar·Exaone / 다른 매체 GPT 출력. 위 3건 중 2건 이상에서 hold 후보가 재현되면 자동 승격 가능. v1.2 정책처럼 회차 3 결과는 v1.3.1 hotfix로 분리 발행 예정.

PR

#9 — 8 커밋 누적 (인프라 5 + 회차 1 + 회차 2)

출처 (회차 2 외부 데이터)

Loading

v1.2 — 작가 voice profile + 권한 위계

25 Apr 05:56
@epoko77-ai epoko77-ai
a2012a2
This commit was created on GitHub.com and signed with GitHub’s verified signature.
GPG key ID: B5690EEEBB952194
Verified
Learn about vigilant mode.

Choose a tag to compare

Issue #1(@simonsez9510) 후속 첫 릴리스. 외부 contributor의 8.5만 자 단행본 비소설 적용 후기에서 시작해, 그분의 어댑터 reference PR(#3)을 거쳐 메인테이너 schema에 흡수하는 흐름으로 v1.2를 정리했습니다.

코드 변경은 거의 없습니다. voice profile 미주입 시 v1.1과 100% 동일 동작(하위 호환). 신기능을 쓰려면 author-context.yaml을 명시적으로 작성해 작업 cwd 또는 _workspace/{run_id}/에 두면 됩니다.

핵심 변경

  • 권한 위계 §1~§6 신설 (ai-tell-taxonomy.md) — 객관 분류 우선, voice profile은 opt-in, 무력화 불가 패턴(A-8/C-5/D-1~D-6) 영구 default-on, naturalness-reviewer 분리 검증층 보존, 회귀 게이트 정책
  • author-context.yaml 스키마 (references/author-context-schema.md) — 패턴 ID on/off + 임계 완화(multiplier) + Do-NOT 키워드 화이트리스트만 허용. 자유 텍스트 mandate는 schema validator가 거부
  • Multiplier 캡 — 일반 ≤ 2.0, D-1~D-6 ≤ 1.5, A-8·C-5 = 1.0 고정 (임계 우회를 통한 사실상 무력화 방지)
  • Schema validator 책임 강화 — 무력화 불가 disable 거부, 캡 위반 거부, prompt injection escape character 검증, silent fallback 금지(파일 거부 시 명시 에러)
  • reviewer_contract.naturalness_reviewer_voice_blind: true 강제 필드 — §5 분리 검증층을 schema 단계에서 contract로 잠금
  • Telemetryvoice_profile_log.json 발행 (적용·거부·trigger 키워드 추적, §6 회귀 게이트 measurable 입력)
  • 에이전트 주입 분리ai-tell-detector·korean-style-rewriter·content-fidelity-auditor 주입, naturalness-reviewer 의도적 미주입
  • 경로 토큰화SKILL.md의 절대 경로 제거, _workspace/는 cwd 기준 (글로벌 설치 지원)
  • 다운스트림 caller referencereferences/proposals/ (PR #3 어댑터 reference 격리 보존, 메인테이너 SSOT 외부)

사용 예시 (단행본 비소설 작가)

# author-context.yaml — 작업 cwd 또는 _workspace/{run_id}/에 명시 배치
version: "1.0"
profile:
 author: "Won Seongmuk"
 work: "단행본 비소설 (8.5만 자)"
 notes: "단단한 서술체, em-dash 리듬 장치"
pattern_overrides:
 - id: "J-3" # em-dash 임계 완화
 action: "relax"
 multiplier: 2.0
 - id: "A-10" # "~수 있다" 사용 권장 mandate
 action: "disable"
do_not_extra:
 - "1인칭 진입"
reviewer_contract:
 naturalness_reviewer_voice_blind: true

회귀 검증 (정직성 노트)

v1.2 본체는 코드 변경이 거의 없어 회귀 위험이 낮습니다(voice profile 미주입 모드 = v1.1 100% 동등). 그러나 외부 회귀 케이스 검증은 아직 진행되지 않은 self-reported 상태입니다. 답글에서 약속한 외부 케이스 2~3건 검증은 v1.2.1 hotfix로 반영할 예정이며, 외부 케이스 모집 Issue가 별도로 열릴 예정입니다(@simonsez9510 진행).

v1.1 self-dogfooding 정직성 톤을 유지하기 위해, 외부 검증 부재를 release notes에 명시 표기합니다.

외부 contributor

  • @simonsez9510Issue #1 8.5만 자 단행본 비소설 적용 후기 + 개선 제안 4건 + PR #3 어댑터 reference (multiplier 캡·reviewer_contract 강제·telemetry·prompt injection 방어 통찰)

분량

5 commits, 8 files changed, +441 / -12

마이그레이션

v1.1 사용자는 별도 작업 없이 v1.2로 자동 전환됩니다(하위 호환). voice profile을 쓰려면 references/author-context-schema.md를 참고해 author-context.yaml을 작성해 두십시오.

전체 변경 이력: ai-tell-taxonomy.md 버전 관리

Contributors

simonsez9510
Loading

AltStyle によって変換されたページ (->オリジナル) /