都是在明确对方需求以后,再给出进一步的反馈,越反馈越正确,因为你提的要求越难越多,对方需要寻找的范围也越来越,越来越精准只是交流五次就回答出这个问题,周岩还是比较意外的于是他改变了思路,选择提出一个大项目,让01首先提供完成这个大项目需要的步骤而很快,01就给出了步骤,一共五点周岩给出的要求是:对网络文本进行文本统计分析01的回复是:1、导入文本2、文本预处理3、文本统计4、得出结论比较简单,周岩给出具体一点的要求于是01的回复变成了:1、导入文本2、对文本进行预处理,导入停用词表,使用分词工具对文本进行预处理3、对处理后的分词文本,进行词频统计4、对词频统计后的结果进行词频统计分析,得出结论具体了一些,只不过依旧有点儿宽泛不过周岩等不及了,
他直接提出让01根据自己的步骤,生成相关的代码而很快,01就生成了一系列的代码周岩下载了《斗破苍穹》的文本,对这段代码进行验证,很快就得到了不错的数据,虽然不全面,但显然这个项目是能进行下去的周岩又对这段代码提出改进要求,包括词频可视化,把词频用云图展现出来,包括对词频进行文本训练,从而找出词与词之间的关联这一回周岩提出的要求是对两本文本进行处理,两本分别是金庸老爷子的《神雕侠侣》和《射雕英雄传》很快01给出了相应的代码修改,周岩复制粘贴之后,进行测试其实需求也特别简单,就是找主角之间的人物关系杨过对应龙女,那么郭靖对应什么,结果:黄蓉周岩又找了杨过和郭靖分别对应的关联词,同时让01局限在人物身上,自己设计一个人物词判定代码这一回01终于出现了一点错误,比如人物切分上面,会把4个词的人物变成2个词输出这就是细节上的毛病了,周岩现在也不是算法白,知道怎么改进,不过周岩更期待01给出的结果于是他把这个问题粘贴给了01,而01也给出了对词频进行判定,如果两个拆分的词同时出现多次,那么判定两个拆分的词合并成为同一个词,并在字典中删除前面两个拆分词,并对已经分词好的数据进行处理,合并两个拆分词,没有分词好的就以该拆分词作为分词依据,照着分词就校
粘贴进去以后,周岩发现效果意外的不错只是之后人物判别上也出现了一些问题,会把武器什么的加进去周岩又去问01,01回答了一些代码修改,但加进去以后,依旧是老样子,没法做到细致的划分周岩问01有没有什么好的办法,01在处理之前,就把处理的人物给预设出来,这样就不会出现之后判定错误的情况也就是从源头解