- 主题:论本版的互动欲和好感链
jd搜文本分析 或者文本挖掘
一堆手把手教你的书籍
基本都带差不多的案例
【 在 luckyllh 的大作中提到: 】
: 粑粑撒。你研究这些啊
: 以后能否指点指点我学生文本大数据分析。
: 发自「今日水木 on PEDM00」
--
FROM 183.212.112.*
没有通用的新方法
只能说针对哪一种具体信息
模型能吸收这种新信息
其实具体的信息模式还是要靠行业知识自己去发现
然后再教给模型吧
【 在 luckyllh 的大作中提到: 】
: 好吧。粑粑撒不是要搞新方法吗。
: 发自「今日水木 on PEDM00」
--
FROM 183.212.112.*
其实没啥结果才是正常的吧
不过如果做的系统
即使没有预期的结果
但是换个视角
也许也能圆个故事啊
这也可以发的
【 在 luckyllh 的大作中提到: 】
: 就怕折腾好久。啥结果没有。
: 文本提出来的变量都不对。
: 发自「今日水木 on PEDM00」
--
FROM 183.212.112.*
情感分析 (原书第2版)
【 在 luckyllh 的大作中提到: 】
: 也不是包装
: 就是能找出一些以前做不了的数据变量
: 比如情绪
: ...................
--
FROM 183.212.112.*
一辈子做这些简单的东西
也没有觉得无聊呢
【 在 luckyllh 的大作中提到: 】
: 可以让学生学习学习
: - 来自 水木社区APP v3.5.3
:
: ...................
--
FROM 183.212.112.*
首先得有一个关于关键词语的可信度的库
没有的化 自己就要建一个
然后贝叶斯方法就差不多了
【 在 luckyllh 的大作中提到: 】
: 比如说怎么说一段话能让对方觉得更可信。怎么做这个文本分析。
: 发自「今日水木 on PEDM00」
--
FROM 183.212.112.*
没有思路的路
就人工分析 人工提取 人工赋值先
然后自己觉得有点机械性的规律
那就让电脑做
【 在 luckyllh 的大作中提到: 】
: 主要就是可能影响文本可信度的关键变量,怎么从文本提取出来数据。
: - 来自 水木社区APP v3.5.3
:
: ...................
--
FROM 183.212.112.*
做数据分析模型的容易犯的一个错就是
觉得把数据扔到模型就ok了
如果不ok那就去寻找新的模型
这是不对的
首先应该花大把的时间去look insid数据
然后才是去找合适的模型
其实模型不是很重要
重要的是对数据的人工的观察分析
【 在 luckyllh 的大作中提到: 】
: 还要好好琢磨
: 发自「今日水木 on PEDM00」
--
FROM 183.212.112.*