当前播放: 如何在BERT上搭载复杂模型?
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
合辑:新版短视频
如何在BERT上搭载复杂模型?
C++语言面试中,如何深入理解虚函数和多态?
怎样用Jenkins、Docker和CI/CD构建无服务器应用程序?
为什么说Java仍将是未来的主导语言?
如何使Python程序快如闪电,提速30%
如何快速且深入地学习一门新技术?
如何搭建一款高性能、高可用的MySQL架构?
如何实现跨语言的RPC调用?
如何使用Redux实现时间旅行?
如何从0开始深入理解React渲染属性?
如何设计秒杀服务的限流策略?
如何使用React Hooks重构HOC组件?
如何合理地使用MySQL的事务?
如何实现中台服务化编排?
数据库遇到瓶颈都属于数据库问题吗?
如何理解经典目标检测算法Faster-RCNN的实现原理?
缓存穿透、并发使用的解法有哪些?
在Java中如何写一个正确的单例模式?
如何设计出一款好用的分布式定时任务系统?
复杂场景下的Git分支工作流是怎样的?
结合操作系统,如何理解一行Java代码是怎么运行的?
如何优化深度学习数据读取?
如何通过自动化测试技术来提升服务端系统质量?
Kubernetes下如何基于拓扑结构来调度?
如何通过Jenkins快速实现一个持续集成流水线?
当小内存遇上大数据
2019年必学的DevOps流行工具
Kafka某台broker IO阻塞,为何会导致发送方无法发送消息?
什么是C++中的The Rule of Three?
基于时序特性,如何构建一个时序存储引擎?
如何利用反射和泛型编程让你的Java代码更优雅?
C++中为什么move constructor需要加noexcept?
如何使用Postman做接口自动化测试?
给你点“颜色”瞧瞧
如何用Spark实现一个通用大数据计算引擎?
如何让你的Robot Framework飞起来?
如何透彻理解Selenium和WebDriver?
Spring Data JPA 如何进行复杂动态查询?
Spring Data JPA如何实现动态部分更新?
未来的编程语言长什么样?
高并发场景下锁的使用技巧(悲观锁/乐观锁/分布式锁)
为什么React组件要声明key?
为什么React不推荐使用Mixin?
如何设计一个高可用的配置中心?
如何通过代码技巧提升内存使用效率?
如何全面地改造Robust?
如何基于Netty构建一个简单的RPC服务?
Spring Boot中如何使用HTTP/2?
教你10分钟玩转Gradle plugin
如何深入理解Kube-Proxy?

如何在BERT上搭载复杂模型?

王然 众微科技AI Lab技术负责人

自从谷歌发明并开源 BERT 以来,NLP 领域的各种 SOTA 都被它刷新了。在 BERT 之前,虽然有预训练语言模型,比如 ELMo 、ULMFit 等,不过由于它们的模型深度都与 BERT 有较大差距,因此我们该如何使用和微调 BERT ,这对于 NLP 领域的研究者和工程师而言,可以说,都是一个新的值得探索的问题。

讲师介绍

王然,本科毕业于北京大学,后于阿姆斯特丹大学攻读数学和计量经济学双学位,并在蒂尔堡大学攻读营销模型专业。研究方向主要为贝叶斯理论以及泛函分析理论和应用,主要参与的项目方向包括图像、语音、NLP、强化学习、知识图谱的理论和应用等。

曾担任百分点认知智能实验室技术负责人,带领开发了百分点的人机对话机器人和文书校对系统,其中,文书校对系统无论就准确性还是召回率来说,均达到了业界前沿水平。

展开
¥4.99 购买
开通VIP
3
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
其他推荐
44:13
腾讯广告高可用的深度学习技术架构(上)
唐溪柳 腾讯广告总架构师/T4 专家
试看
38:39
腾讯广告高可用的深度学习技术架构(下)
唐溪柳 腾讯广告总架构师/T4 专家
试看
34:02
WebNN - 将硬件加速的深度学习带入开放式Web平台
张敏 英特尔亚太研发有限公司软件技术经理
试看