在线购物者购买意向数据集
详情介绍
“
在线购物者购买意向数据集是一份非常典型的电商用户行为数据,核心目标是根据一次访问会话中的浏览行为、停留时长和访问环境等信息,判断用户最终是否产生购买。

1. 数据集介绍
在线购物者购买意向数据集是一份非常典型的电商用户行为数据,核心目标是根据一次访问会话中的浏览行为、停留时长和访问环境等信息,判断用户最终是否产生购买。
这类数据集天然适合中文搜索场景下的“电商转化预测”“用户购买意向识别”“用户画像与精准营销”关键词,也非常适合课程设计、毕业设计和数据挖掘案例展示。数据公开版本常见于 Kaggle,业务语义明确,建模目标也容易解释。
2. 数据规模与字段说明
该数据集常见版本包含约 `12,330` 条访问会话记录,字段数量约 `18` 个,兼顾数值特征、类别特征和最终购买标签。
常见字段包括:
- `Administrative`、`Informational`、`ProductRelated`:不同页面类型的访问次数
- `Administrative_Duration`、`Informational_Duration`、`ProductRelated_Duration`:对应页面停留时长
- `BounceRates`、`ExitRates`、`PageValues`:页面表现和访问质量指标
- `SpecialDay`:是否临近特殊营销日期
- `Month`、`OperatingSystems`、`Browser`、`Region`、`TrafficType`:访问环境与流量来源
- `VisitorType`:访客类型
- `Weekend`:是否周末访问
- `Revenue`:是否产生购买,通常作为分类任务目标变量
从数据结构上看,这份数据既能支持分类建模,也能支撑行为分析和特征工程,是电商方向里非常实用的一份公开样本。
3. 适用任务方向
围绕这份数据可以展开多个机器学习和业务分析方向:
- 电商购买意向预测
- 用户访问行为分析
- 高转化用户识别
- 电商用户画像构建
- 精准营销策略设计
- 流量来源与转化效率分析
如果你的目标是做一个“既能训练模型,又能讲业务价值”的电商题目,这份数据集非常适合作为起点。
4. 数据质量与使用建议
这份数据集整体结构规整,字段语义比较清楚,上手门槛不高,但在实际使用时仍有几个关键点需要注意:
- `Revenue` 往往存在类别不平衡,评估时不能只看 Accuracy
- `Month`、`VisitorType`、`Weekend` 等字段需要做类别编码
- 这份数据是会话级数据,更适合解释单次访问是否转化,不适合直接替代长期客户生命周期分析
- 如果要进一步扩展到用户画像或精准营销,通常需要继续构造聚合行为特征
对于想快速落地项目的人来说,这种“结构标准、业务明确、特征可解释”的数据是非常省时间的。
<!-- DATASET_VISUALS_START -->
5. 数据观察与可视化
下列图表使用 matplotlib 基于真实数据样本自动生成,重点展示数据宏观概览、缺失值初筛和探索性分析结果。



<!-- DATASET_VISUALS_END -->
6. 适合的项目场景
这份数据集非常适合以下项目方向:
- 基于机器学习的电商平台用户画像构建与精准营销应用
- 基于分类模型的在线购物者购买意向预测
- 基于用户访问行为的电商转化率分析
- 基于电商行为数据的运营人群分层和策略制定
如果你需要把数据集进一步扩展成完整项目,它也很适合加入可视化分析页、预测页和营销建议模块。
7. 数据集亮点
这份数据集的价值主要体现在:
- 电商场景明确,容易写进中文 SEO 标题和文章关键词
- 字段结构清晰,适合快速做特征工程
- 同时支持预测建模和运营分析
- 结果容易转化成“转化率提升”和“精准营销”类业务结论
- 适合教学展示、课程设计、毕业设计和网站内容展示