SNS 로그인
Google Naver Kakao
조회 수 3567 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

위로 아래로 인쇄
?

단축키

Prev이전 문서

Next다음 문서

위로 아래로 인쇄
?
  • 앙띠 2010.04.26 13:18

    검색해 보니 이런글이 있네요.

    다른분들도 참고하시라고 옮겨 봅니다.

    ======================================

    며칠전부터 'pirs'라는 User-Agent명으로 페이지를 너무 많이 긁어가는 경우가 많았다. 어제 하루만 18000여건의 페이지 요청이 발생했다. 웹로그를 살펴봤더니 Referer중에 www.pirst.kr:6600/ 가 남아있다. html 소스를 봤더니 다음과 같은 내용이 나온다. 바로 11월말에 구축했다는 'KISA 개인정보 노출 대응체계' 사이트였다.

    * Project Name :  KISA 개인정보 노출 대응체계 구축
    * Source Name : header.jsp
    * Description : (대응시스템)HEADER
    * DATE : 2009.06.27
    * Author  : OOO
    * History : 2009.06.27


    '다음'에서 'KISA 개인정보 노출 대응체계'를 검색하면 다수의 기사가 나온다. 그 중 '세계일보' 기사 하나만 살펴보자.

    • 방통위와 한국인터넷진흥원(KISA)은 웹사이트에서 노출되는 개인정보를 검색·대응하는 '개인정보 노출 대응시스템'을 23일 구축완료
    • 24일부터 365일·24시간 운영
    • 하루 약 6500개 웹사이트에서 개인정보 노출을 검색
    • 그동안 포털 검색을 활용, 웹사이트에서 주민등록번호만 노출됐는지 검색했으나 이번 상황실 운영을 계기로 신용카드번호·계좌번호 등 9개 개인정보 노출을 검색

    • '개인정보 노출 대응시스템' 무엇이 문제인가.

      1. 대상이 6500여개 웹사이트이다. 개인정보 자체를 취급하지 않는 사이트는 대상에서 제외해야 하는데, 취급 유무 판단은 하지 않는 것으로 보인다. 개인정보가 없는 사이트도 저 'pirs', 'pirst' 봇이 방문을 했기 때문이다.
      2. 하루에 18000여 페이지를 긁어갔다. 문이 열렸다고, 신발자국 내면서 집안 구석구석 먼지하나까지 확인한 것이 아닌가. 그 것도 주인도 모르게 말이다. 목적이 분명하다면 대상 사이트에는 미리 알려줘야하는 것이 옳다.
      3. robots.txt는 전혀 읽지 않는다. 봇(bot)의 기본 룰을 따르지 않는 것이다. 모든 페이지의 개인정보를 확인해야한다는 이유로 robots.txt을 따르지 않는 것으로 보인다. 그러나 비공개가 필요한 페이지를 제외하게 pirs 봇에 맞게 robots.txt을 설정할 수도 있는데, 이 걸 완전히 무시한 것이다.
      4. 모니터링한 대상 사이트의 웹페이지를 개인정보 노출에만 이용할지는 의문스럽다. 페이지 전체를 긁어가는 형태이기 때문이다. 저인망식으로 웹페이지를 마구잡이 긁어가서 감시한다면  웹생태계를 파괴하는 일이 될 수도 있다. 현 정부에서 규제와 감시가 강화됐기 때문에 의심하게 된다.

      5. 만약 개인정보를 취급하지 않는 곳이라면, KISA에 제외요청할 수 있겠지만 2가지 방법 중에 한가지 방법으로 차단조치를 취할 수도 있다.

        1.  웹서버 설정에 User-Agent명으로 차단 (403 페이지로 처리)

        SetEnvIfNoCase User-Agent   "pirs"   notaccept
        SetEnvIfNoCase User-Agent   "pirst"  notaccept

        <Location "/">
            Order allow,deny
            Allow from all
            Deny  from env=notaccept
        </Location>



        2. 방화벽에서 봇 IP를 차단

        pirs 봇은 210.97.192.140~210.97.192.149 에서 접속했다. 방화벽에서 210.97.192.0/24 대역 전체를 또는 해당 IP만 차단한다.
        pirst 봇은 61.111.15.10 과 61.111.15.20, 61.111.15.30 에서 접속했다. pirst봇은 한 두 페이지 정도만 요청이 이뤄졌다. 이 3개 IP는 차단전에 좀 더 지켜보고 요청이 많다면 차단 처리하는게 좋을 듯.


List of Articles
번호 제목 글쓴이 날짜 조회 수
188 라이믹스 배포버전 대댓글 영역도 리프레쉬 안되게 해서 배포되어야 랩퍼투혼 2024.02.11 109
187 유튜브 제목입력되게 하는 방법 가르쳐주세요 ㅋ 3 랩퍼투혼 2024.02.11 178
186 [100분토론 연장전] 유시민 "오늘은 윤 대통령 별로 안 깠습니다"..유승민 "어이가 없네요" 3 file 랩퍼투혼 2024.02.11 106
185 "한국 경기 다 분석해봤는데요"…요르단 감독이 직접 밝힌 '한국을 이긴 이유' (현장영상) / SBS file 랩퍼투혼 2024.02.07 54
184 이영표-조원희도 한숨, 외신은 조롱 ‘구멍난 종이 호랑이’ / KBS 2024.01.27. file 랩퍼투혼 2024.01.27 45
183 이곳은 문하우스의 커뮤니티 게시판 아무컨텐츠나 올리고 이용하셔도 상관없습니다 1 랩퍼투혼 2024.01.24 98
182 문하우스 최근 달라진 획기적인 기능 file 랩퍼투혼 2024.01.24 58
181 [뉴스 ‘꾹’] 선고하더니 "잠시 드릴 말씀이.." 판사의 '당부'에 터져나온 울음 (2024.01.24/MBC뉴스) file 랩퍼투혼 2024.01.24 62
180 기본 글꼴이 나눔이넹 랩퍼투혼 2024.01.24 50
179 에디터의 절정~포스팅 발행의 편의 랩퍼투혼 2024.01.24 47
178 자신의 사이트를 많이 사용해야 불편함을 알 수 있다 1 랩퍼투혼 2024.01.24 65
177 복권놀이로 1등을 쟁취해보세요~ 3 랩퍼투혼 2024.01.13 99
176 TOIL, Gist - 몇 번의 여름 ((After a few summers) - (여름날 우리 X TOIL, Gist) (My Love Ost) file 랩퍼투혼 2023.12.30 73
175 Dead drunk (곤드레 만드레) file 랩퍼투혼 2023.12.27 59
174 [와글와글] 하천 벤치에 묶인 포메라니안‥매정한 견주 (2023.12.27/뉴스투데이/MBC) file 랩퍼투혼 2023.12.27 67
173 '류이치 사카모토: 오퍼스' 거장의 숨결 예고편 file 랩퍼투혼 2023.12.26 59
172 컨텐츠이용 편의성에 대한 건의 2 file 랩퍼투혼 2023.12.26 144
171 가입없이도 글을 쓸 수 있게 해놓으셨군여 ㅋ 3 랩퍼투혼 2023.12.26 112
170 [자막뉴스] "증명해야죠"...수산물 방사능 검사 과정 공개 / YTN file mesinzer@naver.com 2023.12.26 63
169 [23/24시즌 리그 1] 16R LOSC 릴 vs 파리 생제르맹 풀 하이라이트 file 랩퍼투혼 2023.12.25 50
168 The Future of Gaming: StarEngine (4K) file 랩퍼투혼 2023.12.25 51
167 서울 도봉구 아파트서 불…2명 숨져 / KBS 2023.12.25. 1 file 랩퍼투혼 2023.12.25 66
166 "여보세요? 예 굴렀거든요" 이상한 죽음…증거 찾았다 / SBS 8뉴스 file 랩퍼투혼 2023.12.09 72
165 추천과 댓글을 같이할 수 있으면 좋을듯 5 랩퍼투혼 2023.09.13 219
164 [슬램덩크] Faith - 너와 함께라면 3 file 랩퍼투혼 2023.09.08 172
목록
Board Pagination Prev 1 2 3 4 5 ... 9 Next
/ 9
      "