中国综合性科技类核心期刊(北大核心)

中国科学引文数据库来源期刊(CSCD)

美国《化学文摘》(CA)收录

美国《数学评论》(MR)收录

俄罗斯《文摘杂志》收录

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于演化算法的唐诗自动生成系统研究

穆肇南 刘梦珠 孙界平 王成

穆肇南, 刘梦珠, 孙界平, 王成. 基于演化算法的唐诗自动生成系统研究[J]. 华东师范大学学报(自然科学版), 2020, (6): 129-139. doi: 10.3969/j.issn.1000-5641.201921017
引用本文: 穆肇南, 刘梦珠, 孙界平, 王成. 基于演化算法的唐诗自动生成系统研究[J]. 华东师范大学学报(自然科学版), 2020, (6): 129-139. doi: 10.3969/j.issn.1000-5641.201921017
MU Zhaonan, LIU Mengzhu, SUN Jieping, WANG Cheng. Research on a Tang Poetry automatic generation system based on an evolutionary algorithm[J]. Journal of East China Normal University (Natural Sciences), 2020, (6): 129-139. doi: 10.3969/j.issn.1000-5641.201921017
Citation: MU Zhaonan, LIU Mengzhu, SUN Jieping, WANG Cheng. Research on a Tang Poetry automatic generation system based on an evolutionary algorithm[J]. Journal of East China Normal University (Natural Sciences), 2020, (6): 129-139. doi: 10.3969/j.issn.1000-5641.201921017

基于演化算法的唐诗自动生成系统研究

doi: 10.3969/j.issn.1000-5641.201921017
基金项目: 贵州省普通高等学校科技拔尖人才支持计划(黔教合KY字〔2016〕086); 贵州省教育厅青年科技人才成长项目(黔教合KY字〔2018〕274); 贵州商学院院级课题(2019YJJGXM08)
详细信息
    作者简介:

    穆肇南, 男, 教授, 研究方向为数据挖掘. E-mail: 201510249@gzcc.edu.cn

  • 中图分类号: TP391

Research on a Tang Poetry automatic generation system based on an evolutionary algorithm

  • 摘要: 针对基于演化算法的唐诗自动生成系统展开研究. 研究工作主要有: 使用GloVe(Global Vectors for Word Representation)模型训练词向量, 设计了基于关键词和平仄押韵的初始种群方案、基于语法语义加权值的适应度函数、基于锦标赛算法的选择策略、基于启发式交叉算子和启发式变异算子的演化算法; 给出了基于演化算法的唐诗自动生成模型及系统实现. 实验表明, 根据给定关键词, 该系统初步实现了唐诗的自动生成, 生成的唐诗经人工修改后具有一定的欣赏价值.
  • 图  1  系统架构设计

    Fig.  1  System Architecture Design

    图  2  语法语义处理模块流程图

    Fig.  2  Flowchart of grammar semantic processing module

    图  3  唐诗生成模块流程图

    Fig.  3  Flowchart of Tang Poetry generation module

    表  1  单字词表

    Tab.  1  Word list

    字段名数据类型长度描述
    ID Integer 4 词语编号
    Character Nvarchar 255 词语
    Frequency Integer 3 词语频率
    Type Nvarchar 255 词语词性
    Spell Nvarchar 255 词语拼音
    Rhyme Nvarchar 255 词语平仄
    下载: 导出CSV

    表  2  测试数据1

    Tab.  2  Test data 1

    进化次数/次初始种群个体数/个p关键词
    100 20 0.1 花、风、秋、天、春
    200 20 0.1 花、风、秋、天、春
    300 30 0.3 花、风、秋、天、春
    100 30 0.3 花、风、秋、天、春
    200 40 0.5 花、风、秋、天、春
    300 40 0.5 花、风、秋、天、春
    下载: 导出CSV

    表  3  测试数据2

    Tab.  3  Test data 2

    进化次数/次初始种群个体数/个p关键词
    500 20 0.1 花、风、秋、天、春
    1 000 20 0.1 花、风、秋、天、春
    1 500 30 0.3 花、风、秋、天、春
    500 30 0.3 花、风、秋、天、春
    1 000 40 0.5 花、风、秋、天、春
    1 500 40 0.5 花、风、秋、天、春
    下载: 导出CSV

    表  4  测试数据3

    Tab.  4  Test data 3

    进化次数/次初始种群个体数/个p关键词
    100 40 0.1 花、风、秋、天、春
    200 40 0.1 花、风、秋、天、春
    300 60 0.3 花、风、秋、天、春
    100 60 0.3 花、风、秋、天、春
    200 80 0.5 花、风、秋、天、春
    300 80 0.5 花、风、秋、天、春
    下载: 导出CSV

    表  5  测试数据4

    Tab.  5  Test data 4

    进化次数/次初始种群个体数/个p关键词
    100 20 0.2 花、风、秋、天、春
    200 20 0.2 花、风、秋、天、春
    300 30 0.4 花、风、秋、天、春
    100 30 0.4 花、风、秋、天、春
    200 40 0.6 花、风、秋、天、春
    300 40 0.6 花、风、秋、天、春
    下载: 导出CSV

    表  6  部分候选词表

    Tab.  6  Partial candidate vocabulary

    关键词相关候选词数量/个举例
    323 蕊、梅、菜、落、叶
    278 清、浪、雪、雨、笛
    151 霜、叶、萧、冷、寥
    191 白、夜、照、鹭、青
    279 夏、暖、露、翠、香
    下载: 导出CSV

    表  7  仿唐诗适应度值1

    Tab.  7  Assessment of Tang Poetry 1

    进化次数/次初始种群个体数/个pF
    100 20 0.1 3 3 2 3 4
    200 20 0.1 4 2 3 3 4
    300 30 0.3 4 4 2 2 3
    100 30 0.3 3 4 4 4 3
    200 40 0.5 4 3 3 4 3
    300 40 0.5 4 4 4 4 3
    下载: 导出CSV

    表  8  仿唐诗适应度值2

    Tab.  8  Assessment of Tang Poetry 2

    次数/次初始种群个体数/个pF
    500 20 0.1 4 3 3 4 4
    1000 20 0.1 4 4 4 3 4
    1500 30 0.3 4 4 4 3 3
    500 30 0.3 3 4 4 4 4
    1000 40 0.5 4 3 3 4 3
    1500 40 0.5 4 4 4 4 4
    下载: 导出CSV

    表  9  仿唐诗适应度值3

    Tab.  9  Assessment of Tang Poetry 3

    进化次数/次初始种群个体数/个pF
    100 40 0.1 3 3 2 3 4
    200 40 0.1 4 3 3 3 4
    300 60 0.3 4 4 3 3 4
    100 60 0.3 3 4 4 4 3
    200 80 0.5 4 3 3 4 4
    300 80 0.5 4 4 4 4 3
    下载: 导出CSV

    表  10  仿唐诗适应度值4

    Tab.  10  Assessment of Tang Poetry 4

    进化次数/次初始种群个体数/个pF
    100 20 0.2 3 3 3 3 4
    200 20 0.2 4 3 3 3 4
    300 30 0.4 4 4 2 2 3
    100 30 0.4 3 3 3 4 3
    200 40 0.6 4 3 3 4 3
    300 40 0.6 4 2 2 2 3
    下载: 导出CSV

    表  11  生成仿唐诗参数表

    Tab.  11  Parameters of Tang Poetry

    进化次数/次初始种群个数/个p关键词F
    1 500300.34
    下载: 导出CSV
  • [1] 张建华, 陈家骏. 自然语言生成综述 [J]. 计算机应用研究, 2006, 23(8): 1-3, 13. doi:  10.3969/j.issn.1001-3695.2006.08.001
    [2] CHENG W F, WU C C, SONG R H, et al. Image inspired poetry generation in XiaoIce[EB/OL]. (2018-08-09)[2019-06-20]. https://arxiv.org/pdf/1808.03090.pdf.
    [3] YU L T, ZHANG W N, WANG J, et al. SeqGAN: Sequence generative adversarial nets with policy gradient[EB/OL]. (2017-08-25)[2019-06-20]. https://arxiv.org/pdf/1609.05473.pdf.
    [4] 游维. 基于遗传算法的宋词自动生成研究 [D]. 福建 厦门: 厦门大学, 2007.
    [5] 周昌乐, 游维, 丁晓君. 一种宋词自动生成的遗传算法及其机器实现 [J]. 软件学报, 2010, 21(3): 427-437. doi:  10.3724/SP.J.1001.2010.03596
    [6] 曹卫华. 基于进化策略的仿唐诗自动生成系统 [D]. 广州: 广东工业大学, 2011.
    [7] 穗志方, 俞士汶, 罗凤珠. 宋代名家诗自动注音研究及系统实现 [J]. 中文信息学报, 1998, 12(2): 44-53.
    [8] 冯思齐, 吕钢. 利用RNN模型生成中国古典诗歌 [J]. 通讯世界, 2018(2): 361-363. doi:  10.3969/j.issn.1006-4222.2018.02.232
    [9] 刘铮扬. 基于深度学习的中国诗歌自动生成算法研究 [D]. 长沙: 湖南师范大学, 2018.
    [10] 潘正君, 康立山, 陈毓屏. 演化算法 [M]. 北京: 清华大学出版社, 1998.
    [11] 彭定求, 沈三曾, 杨中讷, 等. 全唐诗 [M]. 北京: 中华书局, 2018.
    [12] MITCHELL M. An Introduction to Genetic Algorithms [M]. Cambridge: MIT Press, 1998.
    [13] 葛继科, 邱玉辉, 吴春明, 等. 遗传算法研究综述 [J]. 计算机应用研究, 2008, 25(10): 2911-2916. doi:  10.3969/j.issn.1001-3695.2008.10.008
    [14] 俞士汶, 段慧明, 朱学锋, 等. 北京大学现代汉语语料库基本加工规范 [J]. 中文信息学报, 2002, 16(5): 46-64.
    [15] 张忠纲. 全唐诗大辞典 [M]. 北京: 语文出版社, 2000.
    [16] 朱武. 基于种群自适应策略的差分演化算法及其应用研究 [D]. 上海: 东华大学, 2013.
    [17] 叶汝骏. 论唐代的仄韵五律—兼论仄韵律诗的归属问题 [J]. 武陵学刊, 2017, 42(3): 91-95. doi:  10.3969/j.issn.1674-9014.2017.03.017
    [18] 张冬茉, 葛永, 姚天昉. 多语种自然语言生成系统中的预映射句子规划器[D]. 北京: 北京大学, 2004
    [19] 胡俊峰, 俞士汶. 唐宋始中词汇语义相似度的统计分析及应用 [J]. 中文信息学报, 2002, 16(4): 39-44. doi:  10.3969/j.issn.1003-0077.2002.04.005
    [20] 易勇. 计算机辅助诗词创作中的风格辨析及联语应对研究 [D]. 重庆: 重庆大学, 2005.
  • 加载中
图(3) / 表(11)
计量
  • 文章访问数:  153
  • HTML全文浏览量:  104
  • PDF下载量:  14
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-08-27
  • 刊出日期:  2020-11-25

目录

    /

    返回文章
    返回