협우인포테크(주)는 Apryse사의 한국 공인 파트너입니다.
데이터 프라이버시와 보안이 매우 중요한 시대에, 문서의 민감한 정보를 보호하는 것은 그 어느 때보다 중요합니다. 이를 달성하는 업계의 표준 보안 방식은 기밀 정보를 숨기거나 영구적으로 삭제하는 ‘수정’(redaction) 입니다.
이 글에서는 문서 삭제란 무엇이고, 어떻게 할 수 있는지, 그리고 PDF 문서의 ‘진정한’ 보안 삭제가 왜 중요한지를 살펴보겠습니다. 또한 Apryse WebViewer SDK가 업계 최고의 렌더링, 변환 및 문서 조작 기능 외에도 보안 문서 삭제를 위한 포괄적인 솔루션을 어떻게 제공하는지도 보여 드리겠습니다.
수정(Redaction)이란 무엇인가?
수정은 문서의 민감한 정보를 가리거나 제거하여 무단 접근이나 공개되는 것을 방지하는 과정입니다. 문서의 무결성과 구조를 유지하면서 개인 ID 번호, 재무 정보나 기밀 문단 같은 특정 내용을 선택적으로 표시하거나 삭제하는 것을 포함합니다.
과거에는 검정 마커나 유성 페인트 같은 도구를 사용하여 문서 정보를 물리적으로 가리는 것을 수작업 하였습니다. 종이에는 메타데이터가 없어 삭제할 필요가 없기 때문에 간단하지만 지루한 일이었습니다. 하지만 20세기에 복사기가 발명되면서 삭제된 문서를 필요한 만큼 복제할 수 있는 큰 이점을 얻게 되었습니다.
20세기 중반 수정된 문서 예시 그림
1993년 PDF가 등장하면서 종이를 사용하지 않고도 문서를 쉽게 공유할 수 있게 되었고, 1997 년에는 Acrobat을 위한 최초의 PDF 편집 플러그인이 출시되었습니다. 2006 년에는 PDF 1.7 사양이 나오면서 편집 주석(redaction annotation) 개념이 도입되었고, 이는 수정(편집)이 이제 PDF의 “표준” 기능이 되었다는 것을 의미합니다.
수정(Redaction), 편집이 왜 필요한가요?
PDF 편집은 민감한 기밀 정보를 다루거나, 유럽 연합의 일반 데이터 보호 규정(GDPR), 미국의 Health Insurance Portability and Accountability Act(HIPAA)와 같은 데이터 보호 및 개인 정보 보호 규정이 적용되는 다양한 산업에서 일반적으로 사용합니다. 정보의 안전한 편집은 조직이 이러한 규정을 준수하고 처벌 받을 가능성을 피하는데 도움이 됩니다.
PDF 편집을 활용하는 주요 산업은 다음과 같습니다.
법률(Legal) : 로펌, 법원, 법률 전문가 들은 개인 정보, 재무 기록, 또는 기밀 통신 등 민감한 정보가 포함된 문서를 자주 다룹니다. 문서 수정(삭제)는 문서를 공유하거나 제출하기 전에 기밀 정보가 삭제 되었다는 것을 확실하게 해 줍니다.
정부(Government) : 다양한 정부 기관은 보호가 필요한 기밀이나 정보를 다룹니다. 국가 안보, 정보, 법 집행 또는 공공 행정과 관련된 PDF 문서의 민감한 데이터를 보호하기 위해 편집을 합니다. 예를 들어, 해당 정보가 정보공개법(Freedom of Information Act/FOIA) 요청에서 제외되는 것이 그런 경우입니다.
의료(Healthcare) : 의료 산업은 HIPPA와 같은 개인 정보 보호 규정으로 보호되는 민감한 환자 정보를 다룹니다. 의료 기록, 연구, 보험 청구 및 기타 의료 관련 문서는 개인 정보에 대한 무단 접근 방지를 위해 종종 삭제가 필요합니다.
금융 및 은행업(Finance & Banking) : 은행, 투자 회사, 회계 법인을 포함한 금융 기관은 기밀 재무제표, 고객 기록, 거래 문서 및 기타 민감한 정보를 취급합니다. Gramm-Leach-Bliley Act(GLBA) 같은 규정을 준수하고 고객의 개인 정보를 보호하는데 PDF 파일 삭제는 필수적 입니다.
인사부(Human Resources) : 인사부는 사회보장 번호, 급여 정보, 성과 평가, 징계 조치 등 직원의 개인 정보를 정기적으로 처리합니다. PDF 암호화 기능은 인사 담당자가 문서를 공유하거나 법적 문의에 대응할 때, 민감한 직원 데이터를 보호하는데 도움이 됩니다.
교육(Education) : 대학교, 단과대학, 초/중/고등학교를 포함한 교육 기관은 학생 기록, 성적증명서, 재정 지원 서류 및 기타 기밀 정보를 처리합니다. PDF 편집 기능은 학생의 개인 정보를 보호하고 가족 교육 권리 및 개인 정보 보호법(FERPA)과 같은 관련 데이터 보호법을 준수하는데 도움을 줍니다.
연구 개발(Research & Development) : 제약, 생명공학, 엔지니어링 등 연구 개발에 참여하는 산업에서는 PDF 편집을 통해 지적 재산권, 특허 출원, 연구 결과 및 기타 민감한 정보를 내부적으로 또는 외부 협력자와 공유하기 전에 보호합니다.
보험(Insurance) : 보험 회사와 대리점은 보험 증권, 보험 청구 양식, 의료 기록 및 기타 민감한 데이터를 처리합니다. PDF 편집 기능은 개인 식별 정보(PII)를 보호하고 업계 규정을 준수하는데 도움을 줍니다.
이러한 산업 분야에서는 일반적으로 PDF 편집을 활용하지만, 민감한 정보를 무단 접근이나 공개로부터 보호해야 하는 모든 분야에서 편집이 필요할 수 있다는 점에 유의하는 것이 중요합니다.
Angular에서 작업하시나요 ? WebViewer를 사용하여 Angular에서 편집하는 방법에 대한 자세한 가이드를 여기에서 확인하십시오.
PDF 수정 작업은 어떻게 하나요?
PDF 문서를 편집할 때는 기밀 정보를 흐리게 하거나 가리는 것이 아니라 완전히 제거하는 것이 중요합니다. 흔히 저지르는 실수 중 하나는 문서를 열고 편집할 텍스트 위에 검은색 사각형을 그리는 것 입니다. 이렇게 하면 사각형이 원본 내용 위에 이미지 레이어로 추가될 뿐이며, 이 사각형을 쉽게 제거하면 그 아래 있는 “편집된(수정된)” 텍스트가 드러납니다.
안전한 또는 “진정한” 편집을 위해서는 문서의 나머지 부분은 그대로 두고 편집된 내용만 실제로 제거하는 소프트웨어가 필요합니다. 앞서 언급했듯이 PDF 사양 1.7 버전에서는 2 단계(또는 3 단계 선택 가능) 프로세스를 통해 보안 편집을 가능하게 하는 편집 주석 기능이 도입되었습니다.
첫 번째 단계에서는 민감한 내용을 식별하고 그 위에 삭제된 내용을 적용합니다. 두 번째 단계에서는 삭제된 내용을 검증 후 적용합니다. 이렇게 하면 PDF 문서의 컨텐츠 스트림에서 삭제된 텍스트가 완전히 제거됩니다. 또한, 문서에 북마크나 링크와 같은 메타데이터가 포함되어 있는 경우, 메타데이터에 민감한 정보가 포함되어 있다면 해당 데이터를 삭제해야 할 수 있습니다.
Apryse Web Viewer를 사용하여 편집할 컨텐츠를 선택합니다.
수정이 잘못 되는 경우
PDF 형식이 민감한 데이터의 “진정한” 삭제를 허용한다는 사실에도 불구하고, 최근 몇 년 동안 삭제된 PDF 문서에서 기밀이나 데이터가 유출된 주요 사건이 여러 번 발생하였습니다. 가장 유명한 사례 중 하나는 2019년 트럼프 전 선거대책본부장 폴 매너포트의 변호인 들이 로버트 뮬러 특별 검사팀이 2016년 대선에 러시아가 개입한 사건에 대한 보고서(뮬러 보고서로 더 잘 알려져 있음)에 대한 공식 답변서를 제출한 것 입니다. 보고서는 매너포트가 검찰에 증언할 때 거짓 진술 했다고 밝혔지만, 변호인 들은 상당 부분 삭제된 답변서에서 의뢰인이 “최선을 다해 완전하고 진실된 정보를 제공했다”고 주장했습니다.
그러나 기자 들은 곧 편집된 것으로 추정되는 텍스트가 두꺼운 검은색 막대로 가려져 있었고, 새 문서에 복사하면 편집되지 않은 텍스트가 마법처럼 보인다는 사실을 발견했습니다. 아마도 누군가 PDF로 내보내기 전에 Word의 형광펜 도구를 사용하여 텍스트 위에 선을 그었거나 소프트웨어를 사용하여 편집 주석을 했지만 PDF를 저장할 때 “적용(apply)”하는 것을 잊었을 가능성이 높습니다. 어떤 일이 있었든 정치적, 법적으로 민감한 정보가 공개되었고, 이는 매너포트의 법무팀이 원치 않는 최악의 상황이었을 것 입니다.
유럽위원회와 국제 바이오 제약회사 아스트라제네카 간의 분쟁 중인 코로나 19 백신 계약이 공개된 후, 또 다른 “삭제 실패(redaction failure)” 사례가 널리 보도되었습니다. 계약서 본문의 민감한 내용은 적절히 삭제되었지만, 삭제된 정보의 상당 부분이 문서 북마크에 여전히 남아 있었습니다. 아래 스크린샷에서 볼 수 있듯이, 이 정보에는 8억 7 천만 유로에 달하는 예상 원가와 공개되어서는 안 될 기타 정보가 포함되어 있었습니다.
북마크 데이터에서 일부 복구된 삭제 텍스트가 포함된 AstraZeneca 계약서 입니다.
이러한 편집 오류 사례는 많지만, 기밀 데이터를 실수로 공개하는 것만이 편집된 문서에 문제가 생길 수 있는 유일한 원인은 아닙니다. 뮬러 보고서와 련된 또 다른 사례가 있는데, 이번에는 외부 법무팀이 아니라 법무부의 잘못이었습니다. PDF협회의 일련의 기사에서 자세히 설명했듯이, 미국 법무부(DoJ)가 처음 공개한 것은 검색 가능한 텍스트가 있는 “Native” PDF가 아니라, PDF에 포함된 저 화질 스캔 이미지 모음이었습니다.
이는 컨텐츠 배포를 어렵게 만들 뿐만 아니라 ADA/섹션 508 규정을 위반했기 때문에 특히 실망스러웠습니다. 재활법(Rehabilitation Act) 508조는 장애인이 디지털 문서에 접근할 수 있도록 모든 연방 기관이 보장하도록 요구하며, 법무부는 공개 문서가 섹션 508을 준수하고 화면 판독기와 같은 접근성 소프트웨어로 쉽게 처리할 수 있다는 명확한 정책을 가지고 있습니다. 접근성을 갖추려면 PDF 문서가 PDF 보관 표준(PDF/A)의 “레벨 a” 또는 이상적으로는 보편적 접근성을 위한 PDF 표준(PDF/UA)을 준수해야 합니다. 이러한 표준은 문서에 계층적 구조 트리로 쉽게 검색하고 태그를 지정할 수 있는 텍스트가 있어야 하며, 이를 통해 읽기 순서, 그림, 표와 같은 요소가 메타데이터를 통해 명확하게 식별될 수 있어야 합니다.
PDF 협회의 분석에 따르면, 편집은 수작업이 아닌 전문 소프트웨어를 통해 이루어졌지만, PDF 문서의 경우, 보고서의 전반적인 상태는 좋지 않았습니다. 검색 불가능한 텍스트, 태그 미 부착, 문서 구조의 결함 등 여러 문제점이 있는 뮬러 보고서의 편집된 PDF는 정부 기관의 보관 및 근접성 요건에 적합한 현대식 디지털 문서와는 거리가 멀었습니다. 검색 가능한 텍스트 레이어와 접근성 태그를 추가하기 위해 OCR을 사용한 버전이 최종적으로 공개되었지만, 원본 문서의 품질이 좋지 않아 여전히 많은 문제가 남아 있었습니다.
이제 문서를 삭제할 때, 하지 말아야 할 일이 무엇인지 알았으니, 어떻게 해야 하는지 살펴보겠습니다.
Apryse WebViewer SDK 소개
Apryse WebViewer SDK는 강력한 데이터 삭제 기능을 애플리케이션과 Workflows에 원활하게 통합할 수 있도록 지원하는 강력한 소프트웨어 개발 키트 입니다. 강력하고 사용자 친화적인 웹 뷰어를 사용하면 데이터 삭제 프로세스를 간소화하고 자동화하여 데이터 보안을 강화할 수 있습니다.
민감한 컨텐츠의 안전한 편집을 위해 제공되는 주요 기능과 이점은 다음과 같습니다.
1. 텍스트와 이미지 자동 수정
ApryseWebViewer SDK는 고품질 변환 기능을 통해 PDF 및 30 가지 이상의 다양한 문서 유형을 자동으로 편집할 수 있으며, PDF, MS Office 파일, 이미지 유형을 자동으로 편집할 수 있도록 지원합니다. PDF, MS Office 파일, 이미지 등에서 데이터를 제거해야 하는 경우, WebViewer가 해결합니다. 민감한 컨텐츠의 정확한 식별과 편집을 지원하여 기밀 정보를 완벽하게 보호합니다.
2. Regex 기반의 수정
WebViewer는 정규 표현식(regular expression) 기반의 삭제 기능도 지원하여 사용자가 특정 유형의 컨텐츠를 식별하고 삭제하기 위한 사용자 맞춤형 패턴을 정의할 수 있도록 합니다. 이 기능은 복잡한 데이터 형식이나 반복되는 패턴을 처리할 때 특히 유용합니다.
3.벌크 수정(Bulk Redaction)
ApryseWebViewer SDK를 사용하면 사용자는 문서나 문서 저장소에서 자주 발생하는 민감한 정보를 효율적으로 삭제할 수 있습니다. 이 기능은 특히 대량의 문서를 처리할 때 시간과 노력을 절약합니다.
4. 시각적 수정 검증
SDK는 사용자가 문서를 완성하기 전에 편집된 컨텐츠를 미리 보고 확인할 수 있는 시각적 검증 기능을 제공합니다. 이를 통해 정확성을 보장하고 민감한 정보가 실수로 유출될 위험을 최소화 합니다.
5. 메타데이터 수정
ApryseWebViewer SDK는 눈에 보이는 컨텐츠 외에도 작성자 이름, 타임 스탬프(timestamps), 수정 내역과 같은 문서 메타데이터도 삭제합니다. 이러한 포괄적 접근 방식을 통해 잠재적으로 민감한 모든 정보를 보호할 수 있습니다.
6. 수정 협업
SDK는 협업 편집 기능을 지원하여 여러 사용자가 문서 편집 작업을 동시에 수행할 수 있도록 합니다. 의사 결정권자는 편집 작업을 할당하고, 진행 상황을 추적하고, 감사 추적을 유지하여 팀워크와 책임의식을 강화할 수 있습니다.
7. 문서 워터마킹
문서 보안을 더욱 강화하기 위해 ApryseWebViewer SDK는 문서 워터마킹 기능을 제공합니다. 직원 들은 “기밀” 또는 “배포 금지”와 같은 워터마크를 편집된 문서에 추가하여 엄격히 관리되는 문서임을 강조할 수 있습니다.
8. 비디오/오디오 수정
문서 내 데이터의 안전한 편집에 대해 자세히 다루었지만, 민감한 정보가 포함된 동영상이 있다면 어떻게 해야 할까요 ? 애드온 비디오 SDK를 내장하면 별도의 비디오 편집 소프트웨어를 사용하지 않고도 WebViewer를 사용하여 프레임 별로 비디오에 주석을 달고 편집할 수 있습니다. 비디오 타임라인에서 편집 길이를 조정하고 비디오나 오디오, 또는 둘 다 편집할지 선택만 하면 됩니다.
편집된 문서를 안전하게 처리하는 방법에 대한 4 가지 팁을 알아 보십시오. 블로그를 읽어 보세요.
결론
기업 들이 민감한 정보 보호라는 과제에 직면함에 따라, 강력한 문서 삭제 프로세스 구현이 더욱 중요해지고 있습니다. Apryse WebViewer SDK는 안전하고 효율적인 문서 삭제를 위한 올인원 솔루션을 제공합니다. Apryse는 프로세스 자동화, 정규식 기반 문서 삭제, 협업 Workflows 활성화, 그리고 포괄적 검증 기능을 통해 기업이 기밀 정보를 보호하고 개인정보 보호 규정을 준수할 수 있도록 지원합니다.
문서 보안을 강화하고 조직 내 데이터 보호 문화를 조성하는 Apryse WebViewer SDK의 강력한 기능을 경험해 보십시오. Apryse Showcase를 통해 WebViewer의 강력하고 사용자 친화적인 문서 편집 기능과 동급 최고의 렌더링, 변환 및 문서 조작 기능을 직접 경험해 볼 수 있습니다.
Apryse 견적 문의는
상단 문의버튼을 이용해주세요.