全部文章Ta的评论
- j****n2024-08-12530
- 一种适用多指标联合分析长时序数列异常检测和告警降噪的智能运维方案,旨在提出一种实现适用于运维场景自动化告警的方案,提高传统运维人员工作效率。j****n2024-04-28680
- DALL-E2这篇论文,主要是关于图像生成方面的。首先这篇论文的名字是说使用CLIP训练好的特征,来做层级式的依托于文本的图像生成。论文核心思想,一个是借助了对比学习方法,比如说openAI的CLIP模型,已经可以学习到很稳健的一个图像特征,能同时抓住语义信息又能抓住图像的风格信息;另一个是论文提出了两阶段的模型结构,解码器用的是扩散模型,在prior模型里面尝试了自回归和扩散模型,后者效率更高生成的效果更好。j****n2023-05-15180
- 论文主要的贡献点之一是提出一个新模型:inflated 3D network(I3D),把2D模型扩张到3D模型,这样就不用专门设计一个视频理解的网络了,可以使用2D里已经设计好的网络,比如VGG、ResNet直接把它扩张到3D就可以了,甚至利用一些巧妙的方式把预训练模型利用起来,这样不仅设计简单,而且可以省掉很多预训练的麻烦。 另一个贡献点就是提出了一个新的数据集——Kinetics数据集(Kinetics Human Action Video dataset)。这个大型视频行为识别数据集比UCF-101和HMDB-51大了两个数量级。包括400个人类动作的类别,每个类别都有超过400个clips。数据集是从Youtube中搜集的真实场景下的视频。一经提出就得到了广泛的使用。j****n2023-05-111540
共 4 条
- 1
页
没有更多了
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 4 篇文章
文章获得 0 次赞同
文章被浏览 293 次
获得 0 人关注
个人荣誉查看规则
暂未获得荣誉