조회 수 925 추천 수 0 댓글 4
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

https://namu.wiki/w/%EB%82%98%EB%AC%B4%EC%9C%84%ED%82%A4:%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4%20%EB%8D%A4%ED%94%84

일단 저는 제가속한 네트워크 자체가 tor를 막아버려서 접속이 되질 않는 듯 합니다. 

이 정보에는 기여자 정보라는 것이 들어있다고 하는데, DB만으로도 나무위키 내에 있는 항목들을 CCL을 준수한다면 그대로 웹상에 개제하여 사용할 수 있는 것으로 보입니다. 좀 더 자세한 부분을 확인해주실 수 있는 분이 계시다면 이 DB덤프에 대한 분석을 해주실 수 있다면 감사합니다. 

  • profile
    wkpark 2016.05.03 20:23
    전에 sql 형식으로 되어있었을때에 잠깐 테스트해봤지만, 몇가지 문제가 있으나 모니위키로 임포트도 어렵지 않게 가능했습니다.
    json 포맷으로 바뀐 후에는 테스트 안해봤네요.

    일단 예전의 SQL DB덤프 자체에는 기여자 정보가 전혀 없었고,
    DB덤프 자체만으로는 CCL BY를 지킬 방식이 없었습니다.
    웹상에 올리려면 출처를 나무위키로 명시하거나 CCL BY를 지키게끔 사용자 목록을 제공하거나 링크를 걸어야 합니다.

    json으로 포맷이 바뀌거나 했다고 해서 특별히 분석이 필요할 것 같지는 않네요. 어짜피 페이지이름/내용/최종 변경 시간 등의 정보가 있을 것이고, 이걸 파싱하는 것도 어렵지 않습니다.
  • profile
    choi4624 2016.05.03 21:15

    json 포맷으로 바뀌고 나서 기여자 정보가 포함되어 있다고 하길래 어떻게 기여자 정보가 포함되어 있는지 확인해보려고 하나 압축 해제하는데 1TB..라는 제가 가진 저장공간 크기를 아득히 넘는 결과가 나오길래 뭔가 할 수가 없더라고요; 이 기여자 정보가 어떤 방식으로 있는지는 [[카더라 통신]]으로 어느정도 짐작은 하지만(비교 방식으로 기여자 정보가 있다고 합니다.) 정확히 어떤 구조로 되어있는지는 잘 모르길래 질문해 보았습니다. (로그인 사용자의 경우 로그인 사용자의 ip로 기여자 정보를 넣었는지는 불명. 이러면 불완전한 DB가 되겠네요;) 

  • profile
    wkpark 2016.05.03 21:39

    음.. 놀라운 정보네요.

    뭐 아무튼, 문서의 모든 버전 정보를 가졌을 리는 없을텐데 압축 해제해서 1TB가 넘는다니 문서의 모든 버전을 가졌을지도 모르겠네요.

    (리그베다위키 문서의 경우 ~25만 문서 최종 버전 압축하면 800MB 수준. 압축 안하면 ~2.5GB였음)

     

    아무튼 1TB라 할지라도 압축 해제하고난 후에 모든 문서를 열 필요는 없습니다. head 명령등을 써서 간단히 파일 앞 부분만 확인해 볼 수도 있는 등등등..

  • profile
    choi4624 2016.05.03 21:48
    일단 카더라 통신으로 이 DB가 어떻게 되어있는지는 스크린샷에 남아있기에 특별히 여기서 추가적인 분석을 해도 크게 얻을 것 없을 것 같기 때문에 특별히 추가적인 분석이 필요하지는 않은 것 같습니다.

    덧) 더 시드 엔진의 경우 문서의 모든 버전을 DB화 하면서 각 버전마다 이전 버전의 내용을 포함한 채 저장하고 있다고 합니다. 호스팅 비용 문제도 있고, 처음 만들때부터 DB 기반으로 엔진을 쓰기에 이러한 결과가 나올 수 있다고 봅니다. 근데, 이 기여자 정보가 각 DB별로 되어있는게 아니라 이전 버전과 비교하면서 삽입되어 있다고 합니다. 이래서 불완전한 기여자 정보라는 지적이 있는가 싶어요.


List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 운영에 관한 질문은 받지 않습니다. 함장 2015.08.18 1078
82 특정 문서 편집 차단 문제입니다. 1 paro1923 2017.04.01 72
81 제가 잘못 만든 항목 하나를 삭제하고자 합니다. 4 무식한공병 2016.11.26 97
80 특정 문법이 포함되는 문서 검색 방법에 대해 1 집토끼 2016.06.15 364
79 반달을 되돌리기하다 30분 차단당했습니다. 22 paro1923 2016.05.21 459
78 리그베다 위키 운영진 연락처를 좀 알 수 있을까요? 1 친친고양이 2016.05.13 493
» 나무위키 데이터베이스 덤프를 분석하실 분이 계신가요? 4 choi4624 2016.04.25 925
76 '위키코어미러'라는 주소를 봤습니다. 3 paro1923 2016.03.11 678
75 내용이 가려지는 큰따옴표는 뭔가요 4 유딩이앙 2016.02.09 586
74 위키 문법에 대해 궁금한 점이 있습니다 2 레드불 2016.02.04 486
73 모바일 환경에서 캡션에 이미지가 가려집니다. file choi4624 2016.02.04 513
72 리그베다의 약관문 자체에 난해한 문장이 있습니다. 3 木文娥 2016.01.13 699
71 모바일에서 쪽지함 보는 방법을 알고 싶습니다. 4 choi4624 2016.01.12 547
70 게시글의 댓글 기능을 설정하지 않은 채 게시글을 올려도 되나요? 9 choi4624 2016.01.08 449
69 '김영옥(빅(드라마))' 제목 rename이 필요할 것 같습니다. 6 paro1923 2016.01.04 587
68 제 IP가 블랙리스트에 올라갔다고 합니다. 2 paro1923 2015.12.28 508
67 과거에 제가 기여했던 내용을 삭제하고 싶습니다. 6 lind 2015.12.21 521
66 이 [[매크로]]는 뭐죠? 3 2DU 2015.12.08 493
65 [[He-111]] 리다이렉트 질문입니다. 1 paro1923 2015.11.21 532
64 DMCA 관련해서 궁금한 것이 있습니다. 7 집토끼 2015.11.19 622
63 리그베다위키에 쌓인 오해에는 무엇이 있나요? 8 choi4624 2015.11.12 1257
Board Pagination Prev 1 2 3 4 5 Next
/ 5

더보기

위키 바로가기

XE Login