이 Quora Posts Dataset Sample에는 1,218개 레코드가 포함되어 있으며, Bright Data API를 사용하여 추출되었습니다.
| Field Name | Description |
|---|---|
url |
Quora 게시물의 고유 URL입니다. |
post_id |
Quora에서 각 게시물을 식별하는 고유 식별자입니다. |
author_name |
게시물을 작성한 작성자 이름입니다. |
title |
Quora 게시물의 제목으로, 콘텐츠를 요약합니다. |
post_date |
게시물이 게시된 날짜 및 시간입니다. |
originally_answered |
게시물이 처음에 특정 질문에 답변했는지 여부를 나타냅니다. |
over_all_answers |
해당 게시물이 받은 전체 답변 수입니다. |
post_text |
Quora 게시물의 주요 콘텐츠 또는 본문 텍스트입니다. |
pictures_urls |
게시물에 포함된 이미지의 URL입니다. |
videos_urls |
게시물에 포함된 동영상의 URL입니다. |
extarnal_urls |
게시물에서 참조된 외부 URL입니다. |
upvotes |
게시물이 받은 추천(업보트) 수로, 인기도를 나타냅니다. |
shares |
사용자가 게시물을 공유한 횟수입니다. |
views |
게시물이 확보한 총 조회수입니다. |
top_comments |
게시물에 대한 사용자의 주요(하이라이트) 댓글입니다. |
author_content_views |
작성자가 만든 모든 콘텐츠의 총 조회수입니다. |
author_active_spaces |
작성자가 참여하는 활성 Quora Spaces(커뮤니티) 수입니다. |
author_joined_date |
작성자가 Quora에 가입한 날짜입니다. |
author_about |
작성자에 대한 간단한 설명 또는 소개입니다. |
author_education |
작성자의 교육 배경 정보입니다. |
header |
게시물에 제공된 추가 헤더 정보입니다. |
Quora 게시물의 감성을 분석하여 시장 조사 또는 사회 연구를 위해 다양한 주제에 대한 대중의 의견을 파악합니다.
토픽 모델링을 활용하여 Quora에서 널리 나타나는 주제와 토론을 식별함으로써, 콘텐츠 제작자와 마케터가 청중의 관심사를 이해하는 데 도움을 줍니다.
업보트 및 공유와 같은 참여 지표를 검토하여 Quora 작성자의 영향력을 평가하고, 주요 인플루언서를 식별합니다.
데이터셋은 여러 형식으로 제공됩니다:
- CSV(이 샘플에 포함)
- JSON
- NDJSON
- JSON Lines
- Parquet
- Compressed (.gz)
- API Download
- Webhook
- Amazon S3
- Google Cloud Storage
- Microsoft Azure
- Snowflake
- SFTP
데이터셋은 다양한 일정으로 업데이트할 수 있습니다:
- Once(1회 제공)
- Daily
- Weekly
- Monthly
- Quarterly
- Custom schedules
특정 요구사항에 따라 추가 데이터 포인트로 데이터셋을 강화하십시오. 맞춤형 보강 옵션에 대해서는 문의해 주십시오.
Bright Initiative는 환경 및 사회적 목적을 위해 활동하는 학술 연구자, NGO 및 NPO에 Web Scraper APIs 및 **바로 사용할 수 있는 데이터셋**에 대한 무료 액세스를 제공합니다.
brightinitiative.com에서 무료 액세스를 신청하십시오.