이 Google News Dataset Sample에는 1,000개 레코드가 포함되어 있으며 Bright Data API를 사용하여 추출되었습니다.
| Field Name | Description |
|---|---|
url |
퍼블리셔 웹사이트에서 전체 뉴스 기사로 연결되는 직접 링크입니다. |
title |
주요 주제를 요약하는 뉴스 기사의 헤드라인 또는 제목입니다. |
publisher |
기사를 게시한 조직 또는 개인의 이름입니다. |
date |
ISO 8601 형식의 기사 게시 날짜 및 시간입니다. |
category |
뉴스 기사가 속하는 기본 카테고리 또는 장르입니다. |
keyword |
검색 및 분류를 위해 기사와 연관된 핵심 용어 또는 구문입니다. |
country |
뉴스 기사의 출처 국가 또는 주요 대상 독자 국가입니다. |
image |
사용 가능한 경우 뉴스 기사와 연관된 주요 이미지의 URL 링크입니다. |
시간 경과에 따른 미디어 보도 트렌드를 분석하여 다양한 카테고리와 국가 전반에서 대중의 관심과 미디어의 초점을 파악합니다.
서로 다른 퍼블리셔가 유사한 주제를 어떻게 다루는지에 대한 인사이트를 확보하여, 기업이 미디어 존재감을 효과적으로 전략화할 수 있도록 합니다.
뉴스 기사에서 유행하는 키워드를 식별하여 SEO 전략과 콘텐츠 제작을 강화하고, 타겟 오디언스 참여를 높입니다.
데이터셋은 여러 형식으로 제공됩니다:
- CSV (이 샘플에 포함)
- JSON
- NDJSON
- JSON Lines
- Parquet
- Compressed (.gz)
- API Download
- Webhook
- Amazon S3
- Google Cloud Storage
- Microsoft Azure
- Snowflake
- SFTP
데이터셋은 다양한 일정으로 업데이트할 수 있습니다:
- Once (일회성 전달)
- Daily
- Weekly
- Monthly
- Quarterly
- Custom schedules
특정 요구사항에 따라 추가 데이터 포인트로 데이터셋을 강화할 수 있습니다. 맞춤형 enrichment 옵션은 문의해 주시기 바랍니다.
Bright Initiative는 환경 및 사회적 목적을 위해 활동하는 학술 연구자, NGO 및 NPO를 대상으로 Web Scraper APIs 및 **바로 사용 가능한 데이터셋**에 대한 무료 액세스를 제공합니다.
brightinitiative.com에서 무료 액세스를 신청하십시오.