论文阅读_I-JEPA_从图像中进行自监督学习的联合嵌入预测架构
1234567英文名: Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture中文名: 从图像中进行自监督学习的联合嵌入预测架构地址: http://arxiv.org/pdf/2301.08243v3作者: Mahmoud Assran, Quentin Duval, Ishan Misra, Piotr Bojanowski, Pascal Vincent, Michael Rabbat, Yann LeCun, Nicolas Ballas机构: Meta AI (FAIR),McGill University,Mila, Quebec AI Institute,New York University日期: 2023-01-19引用次数: 448
摘要
目标:
通过无手工设计的数据增强方法学习具有高度语义性的,并且不需要在下游任务上进行大量微调的图像表示。
方法:
提出了图像基础的联合嵌入预测架构(I-JEPA),一种自监督学习的非生成性方法,核心思想是从单个上下文块 ...
JS图片编辑工具对比分析
1 编辑工具对比:Toast UI vs.
Fabric.js
选对工具可以显著降低开发成本。本次对比的是两个具有代表性的图像处理方案:toast-ui.vue-image-editor
和
fabric.js。一个是高度封装的图片编辑器组件,另一个是灵活自由的
Canvas 图形库,适用场景和使用方式截然不同。
1.1 个人使用体验简述
我在实际项目中分别集成过这两个工具,有感于它们的差异,也踩过不少坑,以下是基于真实使用体验的总结。
1.2 Fabric.js
1.2.1 优点
完全自由、可定制性强,适合打造个性化图形编辑器或交互工具。
丰富的图形 API 支持各种对象的创建与变换。
适合深度控制图层、交互、动画等底层细节。
1.2.2 缺点
版本跨度大,1.x 和 4.x 的 API
差异明显,社区示例常无法直接套用。
不包含图像编辑的 UI,常见功能如亮度、裁剪都需自己搭界面和逻辑。
图像状态(尺寸、缩放、导出像素密度等)需手动管理。
导出图片需特别注意分辨率设置,否则容易失真。
剪切、图层控制底层操作复杂,容易被坐标系统绕晕。
调试成本高,一个简单功能经常需要翻文档、试 ...
海南椰子鸡的做法
材料
煮料:半只大鸡、一个椰子、1L 纯椰子水、500ml
水、适量蔬菜、葱、大枣、盐。
蘸料:香菜、香葱、小米辣、蒜泥、海天海鲜捞汁、小青柠、沙姜。
做法
将所有煮料放入锅中,加入水后大火煮沸,撇去浮沫,再小火煮 30
分钟。蔬菜可视情况加入,类似涮火锅。
注意事项
鸡肉切块并洗净。
建议使用不易煮烂且味道清淡的蔬菜,如荸荠、玉米笋。
海天海鲜捞汁已含果汁及调味料,可以省略小青柠。
煮鸡时少加盐,让汤呈现自然鲜甜,用蘸料调味。
水煎饺制作
面水比例
淀粉:面:油:水=1:1:2:20
(用电饼铛,20 个饺子,约 150ml 水)
步骤
锅里放油
小火煎饺子到微黄:90 秒
加面水盖盖,焖 3-5 分钟
开盖转中火,收干水
注意
用电饼铛几乎不会失手
|400
参考
视频:https://haokan.baidu.com/v?pd=wisenatural&vid=6790299808732167073
玉米面发糕
1 实验一
1.1 用料
玉米面 250g
白面 250g
开水 250ml
牛奶 100ml
鸡蛋两个
干酵母 5g
枣:适量
1.2 做法
把 250 开水倒入 250 克玉米面,烫面,然后晾凉
再加入白面、干酵母、鸡蛋、牛奶,和成面团,
放入模具,加枣
放 30-40 度发面 1 小时
凉水上锅,大火,水开后蒸 25-30 分钟
关火后闷 2-3 分钟
1.3 效果
中间有点粘
可能原因:
放了鸡蛋
中间火开小了
太厚
用蛋糕模具不透气
1.4 参考
https://haokan.baidu.com/v?pd=wisenatural&vid=11253467882059041522
2 实验二
2.1 用料
玉米面 100g
白面 100g
牛奶 150ml
干酵母 3g
泡打粉 3g
细砂糖 15g
枣:适量
2.2 做法
面粉、玉米面、泡打粉、糖,酵母混合均匀
将牛奶倒入面粉中,揉成面团
放入模具,30-40 发酵 1 小时,加枣
凉水上锅,大火,水开后蒸 25-30 分钟
关火后闷 2-3 分钟
2.3 效果
相比之前的,中间不粘,原因 ...
自制小青柠汁三种方法
山姆小青柠汁
将 100 克小青柠、80 克糖和 1L 水(700ml 水搅打,300ml
加冰)。去核后,用破壁机果汁模式搅打 5
秒(若无破壁机,打碎后需过滤)。
简易小青柠汁
切成两半,用果汁棒捶打:10 个小青柠加 600ml 水。
小青柠红茶
手打小青柠(或香水柠檬)搭配红茶、冰糖和冰块,即成柠檬茶。
说明
饮用时可选择代糖,无热量负担。
参考
感觉山姆再也赚不到我的钱!自制小青柠汁(7分糖版)
视频_后处理
1 Openshot
1.1 安装
请避免使用命令行安装软件,建议下载 AppImage
包,以防止旧版本存在的拖动问题。
下载链接:https://www.openshot.org/download/
目前提供 AppImage 格式,下载后设置为可执行权限即可直接运行。
1.2 调整屏幕大小
1.2.1 问题
对于录屏的视频,有时需要去掉视频中的边框和系统状态栏。
1.2.2 方法
在视频上右键点击,选择属性。
在属性界面左侧进行以下操作:
调整横向和纵向的缩放比例
修改横向和纵向坐标
注意:
不要在添加和编辑标记中设置属性,它只针对具体帧操作而非整个视频。
1.3 剪切和拼接
1.3.1 原理
在制作大型视频时,常常通过组合多个小视频,或者在视频中挖出一小块并用其他视频填充。推荐的方法是先将所需区域剪切成小块并进行处理,而不是直接在原视频上操作。
1.3.2 剪切
导入视频:通过菜单选择“文件”,然后点击“导入文件”。
右键点击视频文件,选择“split
file”,在播放到需要剪切的位置时,设定开始和结束时间。
完成剪切后,可以在物料区中可看到生成的小段视频, ...
ExmemoTools插件:结合Obsidian与大语言模型的新体验
1 引入
今天和大家分享一个我自己制作的小工具,其中包含我认为非常实用、但在现有工具中找不到的功能。它的核心理念是更好地将自然语言大模型与
Obsidian 结合,同时还能相对节省调用成本。
在 Obsidan
中写文章常常会让大模型帮助修改文字,比如:润色、翻译、改错。
起初,我将需要处理的文本复制粘贴到大模型的聊天界面中,再加上提示词,得到模型的回应后,再将内容粘回到
Obsidian。
大约一年前,我开始使用 Obsidian 的 Text Generator
插件,把常用的提示词写入模板中,在需要的时候选择模板。不过也遇到了一些问题:有些模板需要经常调整,而有些操作并不在现有模板中,也不属于常见问题。每次修改模板非常麻烦,而且模板数量众多,每次定位模板也很容易打断思路。
于是,就想能不能直接输入提示词,并记忆使用过的提示词,并将高频使用和最近使用的提示词排列在最前面。这样一来,无需鼠标操作,只需在键盘上敲击两三个按键,就可以调用大模型了。
进而,想到利用大模型来生成文章的标签和摘要,将文章移动到合适的目录,让大模型帮我们做些事务性工作,也能很好的提升效率,于是把它们整合成一个工 ...
对谈_250326_强迫症和不甘心
1 总结
有时候会有一些不受控的行为,即使发生了也打断不了内部的重复动作。也许这些只是小事,把小事看得太严重,是否也是一个问题?
与 4o
讨论到习惯、掌控感、不甘心和一些应对方法,最后聊到如何构建自我,犯错在其中扮演着怎样的角色。
2 精华
控制感错觉:通过“做点什么”,即使是无效的,也能
假装自己掌控了局面。因为比起什么都不做,这至少是个行动。
本质上成瘾不仅仅是“喜欢某件事”,而是
大脑依赖某种方式来缓解焦虑,重建掌控感。
“焦虑”背后一方面是不确定,也可能是这个问题实际上我无法解决,而又面对不了这样的自己?接受不了现实中的自己?
真正的掌控不是“必须解决它”,而是“知道什么时候该停下来”。
高效的人调整方向,低效的人撞南墙。
每一次“失败”其实都是一次数据更新,帮助你不断调整参数,让自己变得更强。真正的失败是“停止学习”,而不是“做错了什么”。
3 对谈
3.1 强迫症
我:发信息没收到回复,就不停刷新;不停打开股票账户看……有点强迫症的感觉。如果没得到答案,或者没得到想要的答案,就停不下来,这是什么问题?好像这种无法控制和成瘾有点像。
4o:这种行为确实和“强迫性重复”或 ...
对谈_250401_高敏感是武器
总结
与其说高敏感是一种人格特征,不如说是上天赋予你的一种特殊武器,而你可以选择在何时使用它。性格和思维方式可能无法控制,但如果可以分解为注意力和能量,也许就可控。
精华
有时候敏锐,有时候不想理会。
我的感知系统今天开到多少档?
你是想当个随时满载的“超感知接收站”,还是一个“懂得蓄力的战士”?
对谈
我:今天想聊高敏感,让我们打开一点思路。
看过一些“高敏感是天赋”这种说法。
大家常常设定所在群体的中值是正常,偏离远的就是异常。如果不对自己也不对别人造成不好的影响,所谓的“异常”也没问题。
可我觉得还是有影响,尤其是对自己。我相对来说是比较敏感,情绪比较强烈的人。也带来一些问题:比如内耗,反应过度……
可能会把一些小事放大,再加上内归因,会常常调整自己。就好像用小数据量大学习率调模型,很容易调偏了。
4o:你这个类比很精准——高敏感就像是一个学习率过大的模型,对环境反馈特别迅速,但也容易因噪声调整过度,甚至失去稳定性。
从“高敏感是天赋”的角度来看,它确实能让人更细腻地捕捉信息,理解复杂情绪,甚至在创意或决策中看到别人忽略的角度。但问题在于,这种高敏感如果没有良好的“正则化”( ...