Jekyll 블로그를 Naver 검색엔진에 노출하기
Goal
- 기본 환경: Jekyll을 이용한 .github.io 블로그 사용자
- Jekyll을 이용한 .github.io 블로그를 ‘Naver 검색엔진’에 노출하기
네이버 웹마스터 도구에 속성 추가(블로그 등록)
- 네이버 웹마스터 도구에 접속한다.
Naver에 등록하기 위해서는 우선, 네이버 웹마스터 도구에 접속하고 Naver 계정으로 로그인한다. - [사이트추가] 버튼을 선택한다.
- 자신의 jekyll 블로그 주소를 입력하여 속성에 추가한다. (ex.http://[github 사용자명].github.io/)
블로그의 소유자임을 인증한다.
- Naver에서 제공하는 HTML을 다운받는다.
- 다운받은 HTML 파일을 자신의 GitHub Jekyll 블로그의 가장 상위 디렉터리에 올린다.
Git Commit & Push 작업이 필요하다.$ git add . $ git commit -m "Include in Naver search engine" $ git push origin master // 원격 저장소에 변경 내용을 올린다.
- 네이버 웹마스터 도구 페이지로 돌아와 인증을 확인한다.
RSS feed.xml 파일 생성하기
- RSS 란?
- “Rich Site Summary”
- 뉴스나 블로그 사이트에서 주로 사용하는 콘텐츠 표현 방식
- RSS Feed란?
- 사이트에 방문하지 않고도 해당 사이트에 올라오는 글들을 자동으로 모아주는 기능
- 웹 사이트에서 게시하며 자주 업데이트되는 콘텐츠를 제공한다.
- 네이버 및 다음 등의 검색엔진에 자신의 블로그 및 웹 사이트를 RSS 형태로 등록하여 많은 페이지를 더욱 쉽게 노출 시킬 수 있다.
-
feed.xml 생성 방법
Jekyll에는 feed.xml 파일을 만들 수 있는 두 가지 방법 이 있다. 두 가지 방법 중 원하는 방법을 선택하여 적용하면 된다. (필자는 두 번째 방법인 수동으로 feed.xml을 작성하였다.)
sitemap.xml 파일 생성하기
- Sitemap 이란?
- 웹 크롤링 로봇이 이용할 수 있는 웹사이트의 접근 가능한 페이지의 목록
- 웹사이트의 웹페이지를 계층별로 구분지어 웹사이트의 전체 구조를 보여주며, 검색엔진의 크롤링 로봇들이 크롤링 작업에 유용하게 사용할 수 있다.
- sitemap.xml 파일을 사용하면 사이트 및 콘텐츠 구조를 Google 및 기타 검색엔진에 손쉽게 제출할 수 있다.
- 검색엔진에 크롤링해야하는 URL을 알려줌으로써 색인을 생성하는 방법과 색인을 생성하는 방법을 제어한다.
-
sitemap.xml 생성 방법
Jekyll에는 sitemap.xml 파일을 만들 수 있는 두 가지 방법 이 있다. 두 가지 방법 중 원하는 방법을 선택하여 적용하면 된다. (필자는 두 번째 방법인 수동으로 sitemap.xml을 작성하였다.) - sitemap 설정하기
- 포스트를 작성할 때 해당 포스트의 변경 주기나 우선순위 정보 등을 변경하고 싶으면, 아래와 같이 lastmod, sitemap.chagefreq, sitemap.priority 등의 태그 정보를 추가한다.
- 각 포스트의 맨 위에 아래와 같이 sitemap의 옵션을 추가하여 설정할 수 있다.
- 설정이 없을 때의 default 설정은 sitemap.xml에 정의되어 있다.
- sitemap의 changefreq를 너무 짧게 하면 빈번한 접속으로 안좋은 영향을 미칠 수도 있으니 중요한 변동이 없는 포스트는 일주일 정도로 잡아준다.
--- layout: post title: '제목' date: 2017-10-20 lastmod : 2017-10-20 12:00:00 sitemap : changefreq : daily priority : 1.0 ---
주의사항
_config.yml 파일 설정 확인하기
루트 디렉터리(GitHub Jekyll 블로그의 가장 상위 디렉터리)에 존재하는 _config.yml 파일 내의 url 부분에 자신의 블로그 url을 입력해야 sitemap.xml에서 site.url 부분을 사용 할 수 있다.
=> _config.yml 파일 내에 url: ‘http://[github 사용자명].github.io’ 이 있는지 확인한다.
robots.txt 파일 생성하기
- robots.txt 이란?
- 검색엔진의 웹 크롤러가 방문할 때 참고하는 정책을 명시
- robots.txt 파일에 sitemap.xml 위치를 등록해두면 검색엔진의 크롤러들이 홈페이지를 크롤링하는데 도움을 준다.
- robots.txt 생성하기
- robots.txt 파일을 자신의 GitHub Jekyll 블로그의 가장 상위 디렉터리에 생성한다.
- 아래의 코드를 붙여 넣는다.
-
User-agent: * Allow: / Sitemap: http://[자신의 github 사용자명].github.io/sitemap.xml
sitemap.xml, robots.txt, feed.xml 파일 GitHub에 올리기
- Local에서 sitemap.xml, feed.xml 확인하기
- jekyll serve 명령어를 이용하여 로컬 서버를 실행한다.
- http://127.0.0.1:4000/sitemap.xml 에 접속하여 내용을 확인한다.
- http://127.0.0.1:4000/feed.xml 에 접속하여 내용을 확인한다.
- 자신의 GitHub Jekyll 블로그의 가장 상위 디렉터리에 올린다.
Git Commit & Push 작업이 필요하다.
$ git add .
$ git commit -m "Update for Including in Naver search engine"
$ git push origin master // 원격 저장소에 변경 내용을 올린다.
네이버 웹마스터 도구에 feed.xml, sitemap.xml 제출하기
- 네이버 웹마스터 도구에 접속한다.
- 자신이 추가한 연동 사이트를 선택한다.
- feed.xml 제출하기
- 대시보드의 왼쪽에 위치한 🔽 요청을 선택한 후 하위메뉴 [RSS 제출]를 선택한다.
- 빈칸에 ‘http://[github 사용자명].github.io/feed.xml’를 입력한다. (ex.http://[github 사용자명].github.io/feed.xml)
- 확인을 누르면 아래와 같이 제출된 화면을 볼 수 있다.
- sitemap.xml 제출하기
- 대시보드의 왼쪽에 위치한 🔽 요청을 선택한 후 하위메뉴 [사이트맵 제출]를 선택한다.
- 빈칸에 ‘sitemap.xml’를 입력한다. (ex.http://[github 사용자명].github.io/sitemap.xml)
- 확인을 누르면 아래와 같이 제출된 화면을 볼 수 있다.
References
- http://dveamer.github.io/homepage/Sitemap.html
- http://jinyongjeong.github.io/2017/01/13/blog_make_searched/
- http://webisfree.com/2014-08-11/rss-feed%EB%9E%80-rss%EC%9D%98-%EC%9E%A5%EC%A0%90-%EB%B0%8F-%EB%B8%94%EB%A1%9C%EA%B7%B8-%EA%B2%80%EC%83%89%EC%97%94%EC%A7%84%EC%97%90-%EB%93%B1%EB%A1%9D%ED%95%98%EA%B8%B0
- https://github.com/jekyll/jekyll-feed