Video Summary实操记录

主要记录上一阶段有关video summary工作的一些理解和想法
一、《Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward》

众所周知视频标注成本极高,一旦涉及主观评分则需要多个标注人员(多为10人以上)对每一个标注样本进行标注。而视频类别本身又极其丰富,难以在涵盖所有视频类别的情况下进行大量标注。因此本文的无监督+强化学习方法很好的解决了数据成本问题。

Baseline如下图所示。总体上通过去掉了最后输出层的CNN对视频的每一帧进行特征提取,之后将全部输出特征合并送入一个双向LSTM获得对每一帧的选取结果,之后根据当前的Summary结果计算奖励函数(代表性奖励+多样性奖励)。

baseline

就具体代码而言,模型的Summary过程可以具体表述为:

1、顺序读取视频中的每一帧,将每一帧送入CNN(Resnet152等均可)提取特征。这一过程中维护两个array,一个是所有视频帧的特征video_feat,另一个是根据指定间隔(默认15帧)的特征video_feat_for_train

2、根据video_feat、总帧数、fps进行镜头切换检测,获得镜头切分帧和每一段视频segment长度

3、将video_feat_for_train输入RNN网络,对其中的每一帧获得一个【0,1】内的值,训练时依据这个值进行伯努利算法,决定是否选择这一帧,进而进行奖励函数的计算,而Summary时则代表了这一帧的得分(相对重要程度),并将此得分复制给临近区间(默认15帧)内的所有帧。之后按照视频切分segment,对每个segment内的帧得分计算平均值,从而获得每个segment的得分。

4、将问题转换为了0/1背包问题,在限定了最终总长度的基础上,尽可能选取总得分最高的segment们组成Summary。

其他细节:

1、奖励函数

1)多样性函数:就是在计算任意两帧之间的相似性,越不相似则说明多样性更高。值得注意的是,对于相似性高但间隔距离很远的两帧,不能简单认为他们是相似的,这样忽略了时间上的关系。因此指定了一个间隔阈值λ,对于大于此阈值的两帧则d(xt, xt‘ ) = 1。
在这里插入图片描述
在这里插入图片描述

2)代表性函数:旨在希望模型可以选择足够代表视频主体的帧。因此首先对所有帧进行k-medoids problem聚类,簇类中心则是理论上最佳选取对象,通过计算选取帧与中心的距离来衡量选取效果。
在这里插入图片描述

在实际操作中,视频中经常会包含表情包、转场镜头等不重要的快速过度画面,但因为多样性奖励函数的存在会使得模型倾向于选择这样的画面,实际上与视频主体无关。
解决方案:一方面需要提升视频场景边界帧检测准确度,进而过滤间隔过短的视频片段(视为不重要帧);或者建立常见表情包特征库,对相应的特征做相似判断实现过滤。

开源代码易用性强,可以根据具体场景做更多的复加功能和操作。

Luk_ke
关注 关注
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Video Summarise 入门
幸运的小菜鸟的博客
11-19 330
Video summarization” refers to the process of creating a concise and condensed representation of a video, capturing its essential content, key events, or highlights. The goal is to provide a shorter version of the video that retains its most important inf
video caption summary
qq_37609020的博客
02-21 380
1. ECO: Efficient Convolutional Network for Online Video Understanding, European Conference on Computer Vision (ECCV), 2018." By Mohammadreza Zolfaghari, Kamaljeet Singh, Thomas Brox 开源代码:https://gith...
video/audio/summary/marquee/字符实体标签
qq_35381464的博客
04-27 182
video标签 作用: 播放视频 格式: <video src=""> </video> video标签的属性 src: 用于告诉video标签需要播放的视频地址 autoplay: 用于告诉video标签是否需要自动播放视频 controls: 用于告诉video标签是否需要显示控制条 poster: 用于告诉video标签视频没有播放之前显示的占位图片 loop: 一...
视频摘要算法概述
qq_51198285的博客
07-13 3323
DSNet: A Flexible Detect-to-Summarize Network for Video Summarization论文 代码不同于以往将视频摘要视为回归问题(没有考虑时间相关性和完整性约束),2021年,最早的考虑这两者。 视频摘要通常分为三步: 1、镜头边界的检测 2、每帧的重要程度分数预测 3、关键帧选取 现有的视频摘要算法分成三类,无监督、弱监督和有监督无监督的方法,用启发式搜索,代表性、多样性、稀疏性,来发现关键镜头 代表性的方法是基于聚类的、基于字典学习的、子集选择的、强化
深度学习之视频语音+视频摘要+视频显示检测+视频理解--附带源码和作者主页
WJ_MeiMei的博客
11-22 7037
视频语音 Vid2speech: Speech Reconstruction from Silent Video intro: ICASSP 2017 project page: http://www.vision.huji.ac.il/vid2speech/ arxiv: https://arxiv.org/abs/1701.00495 github(official): https:...
AVProVideo.unitypackage
09-28
AVProVideo 视频播放插件,精简
AVPro Video 1.11.4.rar
09-24
unity 播放视频的插件,比原生组件好用多了
stream video download
08-08
google 浏览器网页工具插件
video-codec-sdk
07-20
包括Video_Codec_SDK_9.0.20、Video_Codec_SDK_9.1.23、Video_Codec_SDK_10.0.26、Video_Codec_SDK_11.0.10
Processing 手动安装video
08-12
手动编译后的processing video库, 解压后放在Documents/Processing/libraries目录下,或放入/Applications/Processing.app/Contents/Java/modes/java/libraries中。 重启processing就可以引用。
免费使用支持离线部署使用的 txt2video 文本生成视频大模型(Text-to-Video-Synthesis Model)
最新发布
代码讲故事
01-31 1426
免费使用支持离线部署使用的 txt2video 文本生成视频大模型(Text-to-Video-Synthesis Model)。 文本生成视频大模型(Text-to-Video-Synthesis Model)是一种基于深度学习技术的人工智能模型,它可以将自然语言文本描述转换为相应的视频。即通过输入文本描述,自动生成符合描述内容的视频。
python短视频提取关键帧_提取视频关键帧
weixin_39684228的博客
12-10 584
"""Created on Tue Dec 4 16:48:57 2018keyframes extract toolthis key frame extract algorithm is based on interframe difference.The principle is very simpleFirst, we load the video and compute the inte...
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness R
qq_33331451的博客
11-07 867
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward paper: https://arxiv.org/abs/1801.00054 code: https://github.com/KaiyangZhou/pytorch-vsumm-reinforce conference: AAAI 2018 Abstract   视频摘要的目的是为了方便大规.
python 视频摘要_GitHub - autogyro/VideoCaption: 视频的文本摘要(标注),输入一段视频,通过深度学习网络和人工智能程序识别视频主要表达的意思(Input a vi...
weixin_39609170的博客
12-11 391
VideoCaption视频的文本摘要(标注),输入一段视频,通过深度学习网络和人工智能程序识别视频主要表达的意思Video summary with text, input a video output a txt decribing the video.本程序总共包含3个模块:(1). 视频读取与关键帧提取模块(2). Image caption模块(通过训练一个CNN feature ext...
CV计算机视觉每日开源代码Paper with code速览-2023.12.6
CV计算机视觉
12-11 336
群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,
Deep Reinforcement Learning for Unsupervised Video Summarization阅读笔记
qq_38957497的博客
11-04 1279
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward论文阅读笔记 论文整体概述 对于视频摘要,本文使用了一种无监督的方法,作者认为监督学习不能充分探索深度网络用于视频摘要的潜力,前人有人使用DPPLSTM网络应用于视频摘要,本文将视频摘要描述为一个顺序的决策过程,提出了一个DSN网络,这种网络具有编码结构,其中编码器是一个卷积神经网络(CNN),它对视
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness..
ShaoDu的博客
06-17 907
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward Abstract        视频摘要旨在通过制作短而简洁的摘要来促进大规模浏览视频,这些摘要是多种多样的,并且代表...
【论文阅读笔记】Rethinking the Evaluation of Video Summaries 视频摘要评估
ly59782的博客
04-18 3165
作者发现:随机生成的摘要能够达到与最先进的方法相似甚至更好的性能分数。有时,完全随机方法的性能超过了人工注释器。 分析原因:分数的形成主要取决于视频分割,尤其是片段长度的分布。这主要是由于广泛使用的子集选择算法(背包算法)导致。在大多数情况下,原本的评估方式完全忽略了重要性分数的贡献。因此设计了新的评估方式 两个概念: Keyframes:一些孤立的帧 组成摘要 Keyshots:一些镜头(一组连续的帧)组成摘要 以往的评估方式: 评估流程(基于keyshots,连续镜头): 预测每一帧的
视频浓缩摘要简介
热门推荐
计算机视觉小菜鸟的专栏
04-06 1万+
视频摘要,就是以自动或者半自动的方式,通过分析视频的结构和内容存在的时空冗余,从原始视频中提取有意义的片段,将它们以某种特点的方式重新组合成紧凑的、能够充分表现视频语义内容的浓缩视频。   一、静态视频摘要: 静态的视频摘要,也称之为视频概要(video summary),是以一系列从原始视频流中抽取出来的静态语义单元来表现视频的内容。静态语义单元是诸如关键帧、标题、幻灯片等可以概括表示视频
html video
10-13
<source src="video.mp4" type="video/mp4"> <source src="video.webm" type="video/webm"> <source src="video.ogg" type="video/ogg"> Your browser does not support the video tag. </video> ``` 其中,`...

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • C语言实现矩阵卷积运算 4321
  • Lama:《Resolution-robust Large Mask Inpainting with Fourier Convolutions》解读及实操 2207
  • Lama:《Resolution-robust Large Mask Inpainting with Fourier Convolutions》训练、推理实战记录 2033
  • Video Summary实操记录 530
  • GoogLeNet学习总结 472

最新评论

  • Lama:《Resolution-robust Large Mask Inpainting with Fourier Convolutions》训练、推理实战记录

    2301_77802024: 你好,我目前也在跑这个算法,可以交流一下嘛?

  • Lama:《Resolution-robust Large Mask Inpainting with Fourier Convolutions》训练、推理实战记录

    2301_77802024: 你好,这个问题解决了嘛?表情包

  • Lama:《Resolution-robust Large Mask Inpainting with Fourier Convolutions》训练、推理实战记录

    2301_77802024: 你好,这个问题该怎么解决呐?

  • Lama:《Resolution-robust Large Mask Inpainting with Fourier Convolutions》训练、推理实战记录

    嗯!?: 博主您好,训练自己的数据集报错"value, but got num_samples={}".format(self.num_samples)) ValueError: num_samples should be a positive integer value, but got num_samples=0这个怎么解决呢?

  • Lama:《Resolution-robust Large Mask Inpainting with Fourier Convolutions》解读及实操

    嗯!?: 博主您好,请问训练自己的数据集出现num_sample=0,这个错误是怎么回事呢

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • Lama:《Resolution-robust Large Mask Inpainting with Fourier Convolutions》训练、推理实战记录
  • Lama:《Resolution-robust Large Mask Inpainting with Fourier Convolutions》解读及实操
  • GoogLeNet学习总结
2022年3篇
2020年2篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

PHP网站源码南澳百度竞价包年推广民治网站定制盐田网站推广方案布吉企业网站改版坑梓外贸网站建设民治网络营销松岗网站改版木棉湾百度网站优化惠州百姓网标王推广爱联企业网站制作福永企业网站建设松岗关键词排名吉祥优秀网站设计同乐网站seo优化南澳网站定制南联SEO按效果付费东莞百搜标王爱联网络营销福田网站建设民治建站平湖网站seo优化双龙网站排名优化民治seo网站优化罗湖企业网站改版龙岗网站搜索优化大浪网站建设同乐seo排名荷坳百度seo双龙SEO按天扣费木棉湾网站优化软件歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化