机器人“薇薇”可作诗25首 水平未能超越人类

24.03.2016  12:26

春信香深雪/ 冰肌瘦骨绝/ 梅花不可知/ 何处东风约”,这首诗并非出自人类之手,而是出自机器人“薇薇”之口。3月20日,清华大学语音与语言实验中心(简称CSLT)网站宣布,其作诗机器人“薇薇”经过社科院等唐诗专家评定,通过“图灵测试”,目前可作诗25首左右。

  不过,在人机比赛中,“薇薇”创作古诗的水平还是未能超越现代人类诗人,双方的比分为2.72比3.20(满分5分)。

  薇薇作品及老师评语

  早梅

  春信香深雪

  冰肌瘦骨绝

  梅花不可知

  何处东风约

  老师评语:下字用力,少年人学诗应该如此,但是如果锻炼的过多,也不见得是好的。

  “香深雪”似扣“早梅”,字面新异,然首句解释不通;以“冰肌瘦骨”写梅,用词太旧,“”字也会显得太突兀。后二句写得好,仔细思考有些感慨。句法虽不稳,但还是不错的。

  海棠花

  红霞淡艳媚妆水

  万朵千峰映碧垂

  一夜东风吹雨过

  满城春色在天辉

  老师评语:诗词用意太平常,没有新意。咏物诗或以曲尽物情胜,或以兴寄胜,当有擅场。

  “红霞”这句文词不顺,“淡艳”、“妆水”造语妆饰太过。“万朵”句俗艳,表现物没有见到新点。“一夜”句子平顺,也差不多可以,但不是最好的,不要刻意地这样作。“春色在天辉”,稍微有些意致。

  镜

  照影金精映

  钗头角黍青

  白发红袖下

  明月满庭清

  老师评语:咏闺中物用五言,容易见齐梁风味,但描写事物的能力并不精进。

  “照影”这句语气不好。“钗头”这句摹物,渲染敷衍,勉强可以。以镜中人写镜,得题中应有这番意思。“白发”句出律,而且文词不顺,形象也不佳。“明月”句子平顺,感觉太敷衍了,以“明月”写“”,然后提到“”,此句比较细致。

  “薇薇”能作25首诗

  根据CSLT网站公布结果展示,作诗机器人“薇薇”经过社科院等唐诗专家评定,其创作的诗词有31%被认为是人类创作,通过了“图灵测试”。所谓“图灵测试”是指通过对话分辨真实人类和人工智能的试验,如果机器人超过30%的回答让测试者误认为是人类所答,则通过测试。

  昨天下午,记者联系到了机器人“薇薇”的设计团队成员王琪鑫。他表示,目前,“薇薇”能自行作诗达到25首左右,“只要向机器人给出作诗的关键词,并且选择作诗类型,如宋词 、藏头诗、词牌名、绝句等,‘薇薇’就可以创作诗句了。”王琪鑫说。

  王琪鑫告诉记者,“薇薇”是一款作诗人工智能程序,并不是有型的机器人。这个程序利用的是“深度神经网络”原理。据了解,“深度神经网络”的工作原理是模仿人脑的思考方式,从而使该软件的语音识别速度更快,识别准确率更高。

  “我们通过向机器人输入诗句中的每一句话,或者诗句中的词语,‘薇薇’会不断地将这些输入的诗句和词语进行记忆和组合。”王琪鑫提到,当“薇薇”达到一定的词汇量时,就可以自行吟诗作对。据了解,“薇薇”项目是从去年9月份开始研发的,研发团队的主要成员为清华大学教授王东、北京大学研究生骆天一和来自北京邮电大学的本科生王琪鑫。

  “薇薇”作诗水平未能超越人类

  “做图灵测试时,我们邀请了12位老师对人机写作的诗词进行评定。”王琪鑫告诉记者,将机器人作的10首诗和人类作的10首诗混在一起,由评委老师进行判定,哪些是机器人创作的,哪些是人类创作的。统计结果显示,在机器人所创作的诗词中,有31%被认为是人类创作,即通过了“图灵测试”。

  评委老师还根据格律、流畅度、主题、意境四个方面的因素,对“薇薇”与人类诗人所创作的诗进行打分。遗憾的是,最终薇薇还是以2.72分(满分5分)的平均分败给了人类诗人(3.20分)。

  参与本次打分的老师还对“薇薇”所作的诗进行了评价,在每句诗后面注明了详细的评价过程。

  与“AlphaGo”无可比性 更重视艺术创作

  针对近日世界围棋冠军李世石在与谷歌人工智能“AlphaGo”的“世纪5局”中,以1胜4负的成绩败北一事,王琪鑫认为,“AlphaGo”的工程量是“薇薇”难以企及的,但两者并没有可比性。

  王琪鑫说,“AlphaGo”可以通过与人类较量定输赢,而“薇薇”只是个作诗的机器人,本身不存在较高下。“这两者之间的研究方向是不一样的,所以并不能直接比较强弱,‘薇薇’更注重的是艺术创作”。

  针对此次在人机比赛中战败的“薇薇”,王琪鑫表示,将在以后的研究中继续对“薇薇”的神经结构和学习方法进行改进。

  “设计机器人的初衷,是想试探人工智能是否能拓展到艺术创作领域。未来希望能创造出一个可以帮助人类进行作诗学习的机器人,并且是一个具有‘艺术灵感’的机器人。”王琪鑫说。

  文/记者 马晓晴 实习生 黄小妹