PDF는 ‘껍데기’, 무게는 이미지가 담당합니다
문서 PDF 안에는 페이지마다 렌더링된 비트맵이 들어 있습니다. 스캔본이라면 해상도와 JPEG 품질 설정에 따라 페이지 하나에 수 MB가 들어가기도 합니다.
그래서 pdf 용량 줄이기 전 이미지 압축을 이야기하는 것입니다. 껍데기만 줄여서는 비트맵 바이트가 그대로면 파일이 크게 남습니다.
실무에서 통하는 순서
각 페이지 소스 이미지를 이미지 용량 줄이기로 JPEG/WebP에 맞춥니다. 세로 문서면 긴 변 기준으로 해상도 상한을 정합니다.
그다음 이미지→PDF 변환으로 합칩니다. 완성된 PDF만 다시 줄이는 도구는 별도 기술이 필요해 현재 로드맵에 두었습니다.
주의할 점
문자 인식(OCR)이 들어간 PDF는 구조가 달라 추가 작업이 필요할 수 있습니다. 단순 스캔 이미지 모음이라면 위 순서가 가장 투명합니다.
마무리
이미지 바이트를 줄이면 PDF 전체가 따라서 가벼워집니다.