谷歌开源TFGAN,让训练和评估GAN更简单
极客时间编辑部
讲述:杜力大小:1016.88K时长:02:11
三年前,有学者提出“生成式对抗网络”(Generative Adversarial Networks)的概念,简称 GAN,并逐渐引起 AI 业内人士的注意。自 2016 年以来,学界、业界对 GAN 的兴趣出现“井喷”。
近日,谷歌开源 TFGAN,这是一个轻量级的工具库,其设计初衷是让训练和评估 GAN 变得更加简单。
在训练神经网络的时候,通常需要定义一个损失函数来告诉网络它离目标还有多远。例如,图像分类网络中通常会有一个损失函数,一旦给出错误的分类就会进行惩罚,如果一个网络把狗的照片错当成猫了,那将会出现很高的损失值。
然而,有些问题并不能轻松用损失函数来定义,特别是当它们涉及到人的感知时,比如图像压缩或文本转语音系统。虽然基于 GAN 损失训练的图像比起原图来,信息还是有所丢失,但比起其他的方法,图片更加清晰,包含更多细节。
GAN 这种机器学习技术已经在广泛的应用领域引导人们取得了进步,包括基于文本生成图像、超分辨率以及机器人抓取的解决方案等。然而,GAN 在理论和软件工程上都引入了新的挑战,想要跟上它这种快速的研究步伐非常困难。
而 TFGAN 提供了训练 GAN 的基础设施,也提供经过良好测试的损失和评估指标,并包括易于使用的示例,极具表达性和灵活性。据介绍,它可以从以下几个方面来支持实验。
TFGAN 提供简单的函数调用功能,能覆盖大部分的 GAN 用例,因此仅需几行代码开发者就能用自己的数据训练模型,而且因为是采用模块化的方式构建,它能覆盖更特殊的 GAN 设计。
开发者可以任意使用自己想要的模块,如损失、评估、特征、训练等模块,这些都是独立的。TFGAN 的轻量级设计意味着人们可以将它与其他框架或原生 TensorFlow 代码一起使用。
用 TFGAN 编写的 GAN 模型很容易从未来基础设施的改进中受益,开发者可以从大量已经实现的损失和特征值中进行选择,而不需要再重写。
代码经过了良好的测试,因此不必担心使用 GAN 库时容易出现的数值或统计错误。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论