메인
사업영역
News
SEO
B2X 웹플랫폼 개발
FAQ
웹사이트 제작 상담하기
디지털마케팅
NEWS
마케팅 대행 상담하기
검색엔진최적화 SEO
SEO BLOG
SEO 기술문서
SEO 용어정의
SEO 캠페인 상담하기
BUSINESS OF AWEKERS
MENU
CLOSE
Robots.txt
웹 사이트 내에 존재하는 파일로, 크롤러가 가장 먼저 도달하는 위치
검색엔진이 우리 웹 사이트에 접근할때 가장 먼저 도달하는 곳이 바로 Robots.txt 파일 이라는 곳입니다.
파일이 등록 되어 있다면, 주소창에 “자신의 도메인/robots.txt” 를 검색하면 누구나 접근이 가능합니다.
Robots.txt 파일 예시
주소창에서 fourward.co.kr/robots.txt 를 검색하면 위 이미지와 같은 내용을 확인할 수 있습니다.
Robots.txt는 검색로봇에게 웹 사이트의 페이지를 수집하도록 제한하거나 허용하도록 설정할 수 있습니다. 쉽게 말해, 검색엔진 로봇에게 접근을 제어할 수 있는 “출입국 통제 사무소”와 같은 역할을 하는 곳입니다.
검색엔진에 노출을 원치 않을 경우 해당 파일을 활용하여 안내문에 형식으로 크롤링을 특정 경로에 대해서 자제 시키도록 권고할 수 있습니다.
반대로, Robots.txt 파일을 아무런 설정하지 않았다면, 구글과 네이버 이외의 얀덱스(러시아), 바이두(중국) 등 모든 검색엔진 로봇들은 우리의 웹 사이트의 모든 정보를 읽게되고 검색엔진 결과에 반영하여 노출하게 됩니다.
대부분의 웹 사이트에서는 검색 노출을 많이 하기 위해서 보통은 제한하지 않고 모든 페이지를 허용하고 있습니다.
하지만, 검색엔진에서 robots.txt 파일 유무 또한 파악하고 이에 해당하는 로직 점수를 부여하기 때문에 전문적인 robot.txt을 파일로 설정하여 진행하는 것이 올바르다고 할 수 있습니다.
아래 2가지 항목에 해당 된다면, 설정이 잘못되었기 때문에 수정을 권장 합니다.
1. robots.txt 파일이 없는 경우
2. robots.txt 파일 경로가 잘못 되어 있는 경우
브라우저에서 “메인 도메인/robots.txt” 검색시 미적용의 경우, 현재 파일이 존재하지 않거나 경로가 잘못 설정되어 있습니다.
Robots.txt 파일은 웹 사이트 내부 페이지를 생성해서 만드는 것이 아닌, 자신의 컴퓨터/노트북을 이용하여 텍스트 파일(TXT)로 작성하면 됩니다. 그리고 이 파일은 여러분의 웹 사이트 루트 디렉토리 최상단에 위치해야 합니다. 만약 다른 곳에 업로드 했을시 검색엔진은 해당 파일을 찾을수 없습니다.
요소 | 설명 |
User-agent | 사이트를 크롤링하는 크롤러 명시 (e.g. Googlebot, Yandexbot, Yeti)
(* 사용으로 모든 크롤러 설정 가능) |
Allow | 크롤러의 접근 허용 범위 명시
(/* 사용으로 /이후 모든 페이지 URL에 대한 접근 허용) |
Disallow | 크롤러들의 접근 제한 범위 명시
(/* 사용으로 /이후 모든 페이지 URL에 대한 접근 제한) |
#Sitemap files | 등록 된 sitemap.xml 파일 경로 명시
검색엔진 크롤링 봇이 sitemap.xml에 빠르게 접근할 수 있도록 하여 사이트 내 페이지가 인덱스 될 수 있도록 정보 제공 |
User-agent: *
Allow: /
User-agent: *
Disallow: /
User-agent: *
Disallow: /
User-agent: Googlebot
Allow: /
User-agent: *
Allow: /
Sitemap: https://www.example.com/sitemap.xml
동의어
관련용어