一、数据集概况

https://sites.google.com/site/sbkimcv/dataset/instagram-influencer-dataset

- 33,935 位 Instagram 影响者(分为 9 个类别)
- 10,180,500 个 Instagram 帖子
- 发布元数据(JSON 文件):~37 GB
- 图像(JPEG 文件):~189 GB

作者很nice的,点击 上方链接 给作者留下你的信息,两三天就收到数据集下载链接(谷歌网盘)。


作为 AI for Influencer Marketing 的一部分,我从 Instagram 收集了数据并出于研究目的进行分享。该数据集包含 33,935 位影响者及其 10,180,500 个 Instagram 帖子(每个影响者 300 个帖子)。该数据集包括两种类型的文件: 帖子元数据图像文件

帖子元数据文件采用 JSON 格式,包含以下信息:标题、用户标签、主题标签、时间戳、赞助、点赞、评论等。图像文件采用 JPEG 格式,数据集包含 12,933,406 个图像文件,因为一篇帖子可以有多个图像文件图像文件。如果一篇文章只有一个图像文件,则 JSON 文件和相应的图像文件具有相同的名称。但是,如果一篇文章包含多个图像,则 JSON 文件和相应的图像文件具有不同的名称。因此,我们还提供了一个 JSON-Image_mapping 文件,该文件显示与帖子元数据对应的图像文件列表。

影响者分为以下九类:

  1. Beauty
  2. Family
  3. Fashion
  4. Fitness
  5. Food
  6. Interior
  7. Pet
  8. Travel
  9. Other



二、引用说明

使用 Instagram Influencer Dataset , 需声明数据来源,

“Multimodal Post Attentive Profiling for Influencer Marketing,” Seungbae Kim, Jyun-Yu Jiang, Masaki Nakada, Jinyoung Han and Wei Wang. In Proceedings of The Web Conference (WWW ‘20), ACM, 2020.

@inproceedings{kim2020multimodal,
  title={Multimodal Post Attentive Profiling for Influencer Marketing},
  author={Kim, Seungbae and Jiang, Jyun-Yu and Nakada, Masaki and Han, Jinyoung and Wang, Wei},
  booktitle={Proceedings of The Web Conference 2020},
  pages={2878--2884},
  year={2020}
}



三、其他营销数据



广而告之