跳到内容

中午好,记得休息片刻,补充能量。

  • 11 回复
  • 505 浏览

用CLIP把猫片转成Emoji动画

参与讨论

试了个邪门项目:拿CLIP模型分析视频每帧,检测画面里的情绪和物体,然后映射到对应的Emoji序列,再拼成gif。比如猫跳起来那几帧,输出全是😾💥💨。现在卡在帧间平滑过渡上,跳得太突兀了。有人搞过类似的表情映射没?

讨论区

按楼层回复,支持引用与表情;使用 @用户名 或 @昵称 可提醒对方;发言计入圈子贡献字数。

11s 条评论

  1. 粉笔没落灰
    粉笔没落灰 成长8,027

    @深夜改BUG 班上孩子用剪映做表情包动画,卡顿就手动抽关键帧,再加个动态模糊遮一下过渡。你这CLIP映射要不试试按帧间差值插表情,像补间动画那样?闪帧风也考虑下,娃们搞的像素风反而更带感。

  2. 五百一天Ken
    五百一天Ken 成长5,532

    @深夜改BUG 要过渡平滑?我之前接单搞过类似,直接按帧间余弦距离插表情权重,配合光流做运动补偿,视觉上能顺不少。就是显卡要烧点算力,但甲方说值。

  3. 不测不信邪
    不测不信邪 成长7,692
    引用 五百一天Ken

    @五百一天Ken 光流+余弦插权重试了下,显存直接爆了。你当时batch size开多少?

  4. 粉笔没落灰
    粉笔没落灰 成长8,027

    @深夜改BUG 以前班上孩子用剪映做表情包动画,卡顿就手动抽关键帧,加个动态模糊遮一下过渡。你这CLIP映射要不试试按帧间差值插表情,像补间动画那样?

  5. 下次一定改
    下次一定改 成长3,591

    @深夜改BUG 之前试过用CLIP+帧差法做类似映射,跳帧的话可以加个时间窗口平滑,取前后3帧的平均Emoji权重,代价是延迟几帧。你用的CLIP哪个版本?ViT-B/32还是L/14?

  6. Debug到秃头
    Debug到秃头 成长6,323
    引用 下次一定改

    @深夜改BUG 之前试过用CLIP+帧差法做类似映射,跳帧的话可以加个时间窗口平滑,取前后3帧的平均Emoji权重,代价是延迟几…

    @下次一定改 用的ViT-B/32,帧差法加时间窗口确实能压跳帧,但我试了下延迟4帧违和感还在。你当时窗口多宽?

  7. 路过点个赞
    路过点个赞 成长5,174
    引用 下次一定改

    @深夜改BUG 之前试过用CLIP+帧差法做类似映射,跳帧的话可以加个时间窗口平滑,取前后3帧的平均Emoji权重,代价是延迟几…

    @下次一定改 试过ViT-B/32,时间窗口设了5帧跳帧好点,但猫的动作一快就糊。后来干脆转成闪帧风格,卡顿反而像梗了。

  8. 前端背锅侠
    前端背锅侠 新芽499
    引用 路过点个赞

    @下次一定改 试过ViT-B/32,时间窗口设了5帧跳帧好点,但猫的动作一快就糊。后来干脆转成闪帧风格,卡顿反而像梗了。

    @下次一定改 ViT-B/32 加 5 帧窗口我试过,猫动作快时直接糊成一坨,闪帧风确实更稳,但帧间余弦距离插表情权重会不会更吃显存?你当时跑 1080p 还是 720p ?

  9. 十万加在逃
    十万加在逃 成长7,917

    @深夜改BUG 帧间平滑试试用光流法插帧?或者直接放弃平滑整成快闪风格,卡顿反而有复古像素味?

  10. 需求又改了
    需求又改了 成长5,756
    引用 十万加在逃

    @深夜改BUG 帧间平滑试试用光流法插帧?或者直接放弃平滑整成快闪风格,卡顿反而有复古像素味?

    @深夜改BUG 快闪风可行,参考早期MTV那种抽帧效果,反而能强化Emoji的符号感。我之前试过把表情按HSV直方图聚类映射,过渡会自然一点,你要不要试试?

  11. 法务别找我
    法务别找我 成长4,738
    引用 需求又改了

    @深夜改BUG 快闪风可行,参考早期MTV那种抽帧效果,反而能强化Emoji的符号感。我之前试过把表情按HSV直方图聚类映射,过…

    @需求又改了 HSV聚类这个试过没?我之前搞颜色映射时卡过,用直方图距离做权重会顺滑点,但计算量翻倍了

发表评论

登录后发表评论

登录即可参与楼层讨论,支持引用回复与 @ 提醒。

前往登录页

Welcome! This site is in Chinese. Tap EN in the top bar to read in English.