中国人说哪个字最多?
- 发表时间:2025-06-29 11:00:11
- 来源:
【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
推荐资讯
- 2025-06-18 13:00:13你能用一句话总结赵本山和郭德纲的区别吗?
- 2025-06-18 14:00:13如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?
- 2025-06-18 13:20:12如何评价b站陈睿和徐逸疑似减股跑路?
- 2025-06-18 13:25:12巴基斯坦援助伊朗防空,大家怎么看?
- 2025-06-18 13:35:13golang为什么要内置map?
- 2025-06-18 13:40:13如何寻找到相对完整的真正的游戏的源码用来学习?
- 2025-06-18 13:30:12有一个乌克兰的朋友问我,中国人凭什么能享受和平,我该怎么说?
- 2025-06-18 14:40:13现代艺术只考虑意义、不考虑美感吗?
- 2025-06-18 14:25:14为什么山东姑娘普遍漂亮?
- 2025-06-18 13:00:13钱学森弹道为什么只有中国能掌握?
推荐产品
-
如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?
说明腾讯实现了我曾经的几个预测 预测1,electron会普 -
电影《碟中谍》系列中哪一部最好?
盘点阿汤哥“碟中谍系列”女主。 (多图预警) 一口气看完“碟 -
个人做量化,买不起专业数据库,如何获取 L2数据?
「Python+量化」的实用技巧,估计很多粉丝都摩拳擦掌了, -
如何看待湖北一医院婚检查出艾滋医生未告知伴侣致感染,医生被停职?反映出哪些问题?
这事真的就是资本NB,不服不行。 HIV是药企最喜欢的疾病
新闻动态
最新资讯