从语言统计的角度研究红楼梦
| 作者:白水黑土 标签:红楼梦 | 阅读次数:107 |
![]() ![]() |
| ![]() ![]() | ||||
|
呵呵,大家千万别说我是吃饱了撑着没事干
我记得有前人曾经从统计的角度研究过红楼梦 有个老外还得出一结论说后四十回与前80回是同一人所写 因为从语言统计的角度来看,前后差不多 所以说这个方法是早就有了的 下面简单介绍一下我的专业: 我是学计算语言学的,我的方向也偏向用统计的方法来研究语言 其实从老板一开始让我做这个方向时我就想顺便处理一下红楼梦 只是万事开头难,我原来的专业又与这个毫无关系 所以一直到现在才可以说是开始干正事了 处理大批语料,动不动就得算4、5天 在这期间,我就无法往下编程序 正好我可以利用这个空闲来处理一下红楼梦 所需要的资源是文本格式的红楼梦 我现在想知道的是大家对哪些统计结果比较有兴趣 比如:人物的出场次数、人物的共现概率(比如宝玉是和黛玉出现在一起的概率高还是和宝钗或袭人出现的概率高)、80回前后的字词出现频率等等 呵呵,好像有点无聊吧,而且结果也可能没什么用 所以请大家给我一些建议,或者大家想知道哪些统计结果 我尽量做,当然时间不好保证 因为我的课题完全由我一人负责,而且老板盯的紧 |