2025. 7. 13. 23:32ㆍit
robots.txt 란?
robots.txt는 웹사이트의 루트 디렉터리에 위치하는 텍스트 파일로,
검색 엔진 크롤러(로봇)에게 사이트의 어떤 페이지나 디렉터리를 크롤링(수집)할 수 있고,
어떤 부분은 수집하면 안 되는지 지시하는 역할을 한다고 한다.
기본 구조
User-agent: [크롤러 이름 또는 *]
Disallow: [차단할 경로]
Allow: [허용할 경로]
예시
1. 모든 크롤러가 모든 페이지를 접근 못 하도록
User-agent: *
Disallow: /
2. 모든 크롤러가 모든 페이지를 접근 가능하도록
User-agent: *
Disallow:
User-agent: *
Allow: /
3. /private/ 디렉터리만 막기
User-agent: *
Disallow: /private/
4. Googlebot은 접근 가능, 다른 봇은 차단
User-agent: Googlebot
Disallow:
User-agent: *
Disallow: /
robots.txt의 위치
항상 사이트 루트에 있어야 함
예: https://www.example.com/robots.txt
주의사항
- robots.txt는 보안 도구가 아니다. 크롤러에게 "이 경로는 크롤링하지 마세요"라고 요청할 뿐, 강제로 막는 것이 아니다.
- 민감한 정보는 robots.txt에 적지 말고, 서버 인증 또는 접근 권한으로 차단해야 한다.
robots.txt 검사
URL에 https://example.com/robots.txt를 입력해서 확인
참고
https://searchadvisor.naver.com/guide/seo-basic-robots
robots.txt 설정하기
robots.txt는 검색로봇에게 사이트 및 웹페이지를 수집할 수 있도록 허용하거나 제한하는 국제 권고안입니다. IETF에서 2022년 9월에 이에 대한 표준화 문서를 발행하였습니다. robots.txt 파일은 항상
searchadvisor.naver.com
https://developers.google.com/search/docs/crawling-indexing/robots/create-robots-txt?hl=ko
robots.txt 파일 만들기 및 제출 | Google 검색 센터 | Documentation | Google for Developers
robots.txt 파일은 사이트의 루트에 위치합니다. robots.txt 파일을 만들고 예를 확인하며 robots.txt 규칙을 확인하는 방법을 알아보세요.
developers.google.com
https://seo.tbwakorea.com/blog/robots-txt-complete-guide/
10분 안에 끝내는 robots.txt 총정리 가이드
robots.txt 가 무엇인지 잘 모르시나요? 작성 방법부터, 상황별 예시까지 robots.txt에 대한 모든 것에 대해 차근차근 알려드리겠습니다!
seo.tbwakorea.com
'it' 카테고리의 다른 글
| SVG에 대해서 2 (5) | 2025.08.10 |
|---|---|
| SVG에 대해서 1 (5) | 2025.07.29 |
| Youtube iframe 라이브러리 요청 문제 (3) | 2025.02.03 |
| 도메인 정보 수정 후, 카카오 맵이 동작 안하는 경우 (브라우저 DNS 캐시 문제) (1) | 2024.12.02 |
| FTP, FTPS, SFTP (1) | 2024.08.05 |