“教学参考-29”版本间的差异
来自cslt Wiki
(→教学内容) |
|||
第43行: | 第43行: | ||
===机器作诗的基本方法=== | ===机器作诗的基本方法=== | ||
− | *拼凑法: | + | *拼凑法: 将诗句的词打乱,再按诗的格律要求拼起来,即可得到新诗。这样生成的诗往往合韵合律,但常常语意不通 |
*统计模型法:人类语言有很强的规律性,一些字和词总是同时出现在一首诗中,如“春”和“花”,“山”和“水”。利用这一特点,可以在作诗时优先考虑那些总是在一起出现的字,特别是前后经常搭配在一起的字。微软亚洲研究院提出一种基于统计模型的作诗方法,它认为诗的前一句和后一句有很强的相关性,因此可以由前一句生成下一句。这样一句句往后生成,就可以得到一首合理的诗。 | *统计模型法:人类语言有很强的规律性,一些字和词总是同时出现在一首诗中,如“春”和“花”,“山”和“水”。利用这一特点,可以在作诗时优先考虑那些总是在一起出现的字,特别是前后经常搭配在一起的字。微软亚洲研究院提出一种基于统计模型的作诗方法,它认为诗的前一句和后一句有很强的相关性,因此可以由前一句生成下一句。这样一句句往后生成,就可以得到一首合理的诗。 | ||
*神经网络法:统计模型法不能理解每个字、每个词的意义。神经网络方法可以模拟人的大脑,将不同意义的字置于语义空间中的不同位置,意义相近的字互相靠近,意义不同的字互相远离。这样就可以形成对汉字语义的某种“理解”。基于这一理解,生成的句子会更加合理。同时,神经网络还可以描述字与字,词与词之间的前后搭配关系,特别是较长句子的前后关系,从而使得生成更加流畅。 | *神经网络法:统计模型法不能理解每个字、每个词的意义。神经网络方法可以模拟人的大脑,将不同意义的字置于语义空间中的不同位置,意义相近的字互相靠近,意义不同的字互相远离。这样就可以形成对汉字语义的某种“理解”。基于这一理解,生成的句子会更加合理。同时,神经网络还可以描述字与字,词与词之间的前后搭配关系,特别是较长句子的前后关系,从而使得生成更加流畅。 |
2022年7月17日 (日) 09:01的最后版本
目录
[隐藏]教学目标
- 重温古诗词的特点,引导学生理解人类诗人与机器诗人在诗词创作方面的优势与劣势
- 讲授机器做诗的基础方法,引导学生思考这些方法的基本原理以及各自的优缺点
- 引导学生讨论人工智能在美学理解、艺术创作方面的可行性
教学内容
诗词是中华民族的文化瑰宝
诗歌承载着一个民族的文化底蕴和历史传承。优秀的诗歌流传千载,成为一个民族的文化瑰宝。 早期诗歌起源于劳动人民在生产生活休闲创作的劳动号子,入乐为歌,不入乐为诗。慢慢演变成格式固定,音律协调的文学形式。 诗歌早期格律要求较低,称为古体诗,包括《诗经》《楚辞》及乐府诗等。唐代以后格律日渐严格,形成近体诗,到宋代衍生出词,元代则形成格式更灵活的曲。
机器作诗的意义
不论是哪种类型,诗歌都具有极强的艺术性和感染力,是人类情感的集中体现。诗歌创作十分困难,只有才情俱佳的大诗人才能写出好的作品。 历史上的诗人,无不是惊才绝艳之辈。如果机器学会做诗,而且能打动人的话, 那可能意味着机器具有模仿人类感情的可能。同时,诗歌具有极强的创新性,如果机器能够做诗,说明机器学会了创新。因此,机器做诗本身,不仅是个技术 性的工作,更重要的意义是探索机器与人在基础感情、基础创新能力等非传统智能活动方面的共通性。
古诗的特点
本讲的主要内容关注格律诗的创作。这种诗在格式上具有严格要求,诗人需要在约定的字数内写出合韵、合律的句子,且要求句子通顺、 意境优美。具体如下:
- 字数合理:诗词都有约定的字数,不能更改。如绝句,只能是四句,每句5个或7个字。
- 韵脚一致:特定句子最后一个字韵母相同,称为押韵
- 平仄合规:特定的位置满足平仄要求,以求朗朗上口。对格律诗,格律的基础要求可以总结为“一三五不论,二四六齐全”
- 语句通顺:要求用词合理,表达完整连贯的意义
- 意境优美:要有意境上的美感,激发读者的内心共鸣
在如此复杂的要求下写出一首诗来,无异于戴着脚铐跳舞,非常困难。
机器作诗的优势和困难
机器作诗并不困难。以七言绝句为例,只要选出7×4=28个字来,保证这些字满足绝句的韵律要求,就可以做出一首诗。问题是,写出的诗是否具有较高的质量,能不能引起人的感情 共鸣。
- 机器作诗的优势:机器可以快速搜索所有汉字,保证写出的诗押韵与平仄合规,而人类诗人要做到这些需要反复尝试选择。例如,可以查《诗学含英》《笠翁对韵》等关于用词及格律方面的书,保证选的字合韵合律
- 机器作诗的困难:机器对人类的语言并不理解,因此难以生成语法和语义通顺的句子,难以营造出吸引人的意境。
机器作诗的基本方法
- 拼凑法: 将诗句的词打乱,再按诗的格律要求拼起来,即可得到新诗。这样生成的诗往往合韵合律,但常常语意不通
- 统计模型法:人类语言有很强的规律性,一些字和词总是同时出现在一首诗中,如“春”和“花”,“山”和“水”。利用这一特点,可以在作诗时优先考虑那些总是在一起出现的字,特别是前后经常搭配在一起的字。微软亚洲研究院提出一种基于统计模型的作诗方法,它认为诗的前一句和后一句有很强的相关性,因此可以由前一句生成下一句。这样一句句往后生成,就可以得到一首合理的诗。
- 神经网络法:统计模型法不能理解每个字、每个词的意义。神经网络方法可以模拟人的大脑,将不同意义的字置于语义空间中的不同位置,意义相近的字互相靠近,意义不同的字互相远离。这样就可以形成对汉字语义的某种“理解”。基于这一理解,生成的句子会更加合理。同时,神经网络还可以描述字与字,词与词之间的前后搭配关系,特别是较长句子的前后关系,从而使得生成更加流畅。
作诗的题材选择
一般来说,机器作诗时需要用户给一个关键字或一句话作为输入,机器以此为题材可以写出应景的诗来。也有研究者利用其它方式,比如给一幅画,或一首音乐,一篇文章,都可以写出一首诗来。