Pandoc 기반 아래아한글 변환기 - md, html, docx를 hwpx로 변환하는 오픈소스 도구를 소개합니다.

1 month ago 15

출연연 근무 9년차, HWP 문서 작업의 불편함을 해결하고자 개발했습니다.

개발 배경

  • 2018년: 파이썬 초보 시절, 정규식 기반 HML/HWPML 변환기 시도 - https://github.com/msjang/md2hml
  • 2025년 1월: hwpfy 개발
    • 실시간 공동편집 위키 기반 20여명의 주간업무보고 취합
    • 위키. → DOCX 내보내기 → 공무원 서식 입힌. DOCX로 변환(hwpfy) → 한글앱에서 열어서 HWPX로 저장 → 원내 상급부서에 HWPX로 공유
  • 2025년 12월: pypandoc-hwpx
    • 이제는 충분한 내공이 쌓였다 생각하여, 각 잡고 시간을 투자해서 개발했습니다.

개발 방법

  1. DOCX를 원하는 서식으로 만들고, HWPX로 저장했습니다.
  2. 생성된 DOCX와 HWPX를 unzip하여 XML을 보고 필요 없는 속성들을 날리고 다듬었습니다. 그리고 워드와 한글 앱에서 잘 열리는지도 확인했습니다.
  3. md, html, docx, hwpx 포멧을 비교하는 문서를 만들었습니다. - https://github.com/msjang/pypandoc-hwpx/…
  4. 원래는 위 format_comparison.md를 보고 LLM에게 코딩을 시키려고 했는데, 이미 정답지 HWPX가 있는 상황이라는 걸 깨달았습니다.
  5. Antigravity(Gemini Pro 3)로 여러번 피드백 하면서 만들었습니다. 원하는 형식으로 안나와서 XML을 세세하게 까보면서 피드백을 줬습니다. 포멧 비교 문서를 직접적으로 언급하지는 않았지만, 내용을 숙지한 것이 리뷰하는데 많은 도움이 됬습니다.

추후 할 일

Pypandoc 에서 Python을 걷어내고 하스켈로 코딩해서 Pandoc에 HWPX writer를 기여하고 싶습니다.

Read Entire Article