-
<script src="page-agent.js"></script> 한줄만 넣으면 웹사이트가 AI-네이티브 앱으로 변신
-
브라우저 확장, Python, 헤드리스 브라우저 없이도 동작
- 자연어로 지시하면 나머지는 AI가 처리. 텍스트 기반 DOM 조작 기능으로 스크린샷, OCR, 멀티모달 LLM 필요없음
- 모든 처리가 웹페이지 내부에서 수행되는 in-page 실행 모델로 별도 권한 요청 없이 DOM 요소를 직접 제어함
- OpenAI, Claude, DeepSeek, Qwen 등 다양한 모델 사용가능하며 Ollama로 풀 오프라인도 가능 (API 키 기반 통합)
- 인터랙티브한 UI와 human-in-the-loop 인터페이스 제공
- 북마클 이용해서 아무 웹페이지에서나 테스트 가능
-
Chrome 확장을 설치하면 멀티 페이지를 연결한 테스크도 지원하며, 브라우저 레벨 제어, 외부 연동까지 지원
- 주요 활용 사례
-
SaaS AI Copilot: 백엔드 수정 없이 제품 내 AI Copilot 구현
-
스마트 폼 자동화: 다단계 클릭 과정을 한 문장으로 단축해, ERP/CRM/관리자 도구를 개선
-
접근성 강화: 음성 명령과 스크린리더를 통한 웹 접근성 향상
-
MIT 라이선스 : Repo 는 alibaba/page-agent