华宇拼音输入法论坛

标题: 请关注影视剧对白 [打印本页]

作者: sanwsw    时间: 2011-12-2 09:42
标题: 请关注影视剧对白
这是近日收看影视剧时随意输入的新造词、新造句,希望开发组和词库制作爱好者能够关注、收集影视剧中的人物对白。

发过去好了
不会上屏
办好这件事
办好那件事
腾讯微博
唐小婉
夺冠了
多灌了
灿若桃花
援疆干部
息妫
蔡缪侯
蔡桓侯
桓侯
后悔的是
后悔的事
听众的
挺重的
吸后
息侯
郑祖增
临海蜜橘
锺主任
我指导了
都聊什么
吴院长
武院长
吴园长
武园长
没你哪有他
没你哪有她
这么查
这么插
这么搞
这么世故
命好苦啊
好苦啊
跟他道个歉
跟她道个歉
跟他谈谈
跟她谈谈
没到科室
有苦也有乐
也有乐
没白疼
你真的挺棒的
真的挺棒的
挺棒的
他避我
剧集列表
文的武的
文武都行
过来交
催欠
进课室
进科室
别太挤
记着还
我来打
我来答
你来打
你来答
你来搭
我服他
我服她
我扶他
我扶她
陈文远
你怎么回事
她怎么回事
他怎么回事
孙丽华
孙礼华
菜刀呢
才到呢
就是嘴甜
这件事办好
这件是
那件事办好
做了很多事
很多是
好多是
设备的事
尊敬他
尊敬她
挂哪儿
挂那儿
比我迟
逼我吃
比我还急
去我那儿
千万收下
比你还急
比这儿还挤
比这还挤
都在单位过
在单位住
不是嫌少
你是我员工
也得靠你了
我改还不行
我改还不行吗
想儿子呢
会想儿子
上新手术
变了一个人
怎么派
怎么拍
怎么排
我去安排
停进去了
听进去了
急出病来
急病了
都死了
都撕了
最后悔的事
最后悔的是
你比我
你逼我
你避我
看看他
陪陪他
陪陪她
理解了
拿号
灌多了
管多了
涌泉蜜橘

作者: 朱郭朱    时间: 2011-12-2 09:44
过来支持楼主。
作者: 永远的紫光    时间: 2011-12-2 22:33
将来词库也就要多收集这些口语性质的词了
作者: kingdick    时间: 2011-12-2 22:36
上网找影片的外挂字幕,提取即可。
作者: sanwsw    时间: 2011-12-3 08:44
原帖由 kingdick 于 2011-12-2 22:36 发表
上网找影片的外挂字幕,提取即可。

绝对好思路!
作者: bkbill    时间: 2011-12-3 12:40
原帖由 永远的紫光 于 2011-12-2 22:33 发表
将来词库也就要多收集这些口语性质的词了

支持啊!

作者: richardfsw    时间: 2011-12-3 21:02
添加口语性质的词不会增加低频词汇的出现几率么?

感觉这方面应该依靠大语料库或者智能整句输入功能来解决。不过貌似新版的注意力不在整句输入上面
作者: 紫光蓝天    时间: 2011-12-11 08:32
在网上口语用的是比较多
作者: 一粟    时间: 2011-12-12 11:11
支持!
影视往往最贴近现实,很多流行语都源自影视,值得收藏
作者: sanwsw    时间: 2011-12-12 11:33
原帖由 richardfsw 于 2011-12-3 21:02 发表
添加口语性质的词不会增加低频词汇的出现几率么?

感觉这方面应该依靠大语料库或者智能整句输入功能来解决。不过貌似新版的注意力不在整句输入上面


是收集整理活生生的影视剧中的人物对白的短句,并控制词频不要太高,方言土语性质的两字词不收录,不会影响现有词频的。
作者: 紫光蓝天    时间: 2011-12-22 22:36
不知谁能做个影视对白词库
作者: 紫光蓝天    时间: 2012-2-13 10:52
期待着
作者: michsun    时间: 2012-2-13 16:15
上网找电影字幕是不错得提议,但是要注意现在有很多机器翻译的字幕,常常是不知所云的。同时还有一些翻译的人喜欢用大量的网络语言和火星文,这可不要给收录了。
作者: 古陶瓦    时间: 2012-2-13 16:38
我的库中这类词语已经比较多了,还在继续搜集。
作者: 紫光蓝天    时间: 2012-2-13 16:43
古大师,如果以各种当代电视剧剧本的词语、词频作为素材,制作一个词库,一定是非常好用的词库




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2