对谈_250410_念念无住
[!zk 1748596299927-0] 从单一模型到MoE的转变
来源:来自认知层面松动与个人对话的启发
内容:转换认知从单一模型到MoE(专家模型混合)的核心是接受矛盾、多样性和不一致性,并将其视为系统进化的必要特性,而非内耗的来源。
- 单一模型追求一致性,容易产生内耗。 -
MoE允许不同专家模块在不同情境下灵活协作,减少结构束缚。 -
认知系统进化的标志是增加心理弹性和存在安全感,能够灵活切换和重构认知参数。
相关主题:认知灵活性 模型转换 情绪管理 类别:01_自我建构
1 总结
当我决定将单一模型转换为 MoE 时,仿佛为自己的世界解开了束缚。
无需再执着于一以贯之的逻辑,允许矛盾和不一致的存在,从而减少了内耗。曾经可能过于追求自洽,其实矛盾并不可怕,可怕的是无法容忍矛盾的存在。
面对复杂场景,矛盾几乎是不可避免的。
2 对谈
2.1 无住的次个层面
我:今天想聊聊念念无住,这无住到底是什么层面的?情绪层面的,记忆层面的,还是逻辑认识层面的?
情绪层面肯定能理解,当前的情绪不向后延伸,尤其是坏情绪不让它影响后面;
记忆层面也能理解一部分,比如咱俩聊天,你把对我的总 ...
职高反向路径探索
Yan
大娃临近中考,经常听她说一些报志愿分流相关的事。
他们班有个同学提前报了 3D
建模的职高,自己也挺喜欢的。前几天正好有个朋友问我用大模型做 2D
建模的事,我也在 huggingface
上看了看相关模型,所以我的第一反应是:这类工作可能是第一批被 AI
取代的行业,会不会孩子还没毕业,学的东西就过时了?毕竟职高的课业更新没那么快。然后我俩就讨论了一下,也没什么结论。
今天忽然想:如果我娃也上了这个职高,学一点基础就可以开始在这个领域调优大模型了,找几个优化的点做做,社区贡献个模型,然后写
paper,找几个哥哥姐姐叔叔阿姨,指导指导,加个名,背个书什么的,在自己的公众号视频号上讲讲。在今天这个时代,有无数的方法证明自己可以,不像之前只有帝王家、独木桥。
4o
反过来想:“有没有可能,让她在看似被 AI 挤压的领域里,用 AI
反超一把。” 如果能在职校学习的同时,反向利用 AI
工具做高阶内容(像模型调优、训练数据整理、效果评估、Prompt
工程),反而可以比普高同龄人更早实践、留下作品。
结合大模型平台(如 Hugging Face、Civitai 等)进行小任务优化 ...
港式奶茶_简易版
说明
无需煮沸和刷洗,材料选择、口感、制作复杂度和还原度整体协调。
制作步骤
将茶包、200ml 牛奶和一块方糖放入杯中。
使用微波炉中高火加热 2.5 分钟,取出后再浸泡茶袋几分钟。
注意
使用三元 72 度奶、Dilmah 红茶和约 10g
方糖,和茶餐厅的港式奶茶几乎无区别。(>>盒装奶 + 立顿 +
白糖)。
微波加热加时液体不要过满,容易溢出。
论文阅读_I-JEPA_从图像中进行自监督学习的联合嵌入预测架构
1234567英文名: Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture中文名: 从图像中进行自监督学习的联合嵌入预测架构地址: http://arxiv.org/pdf/2301.08243v3作者: Mahmoud Assran, Quentin Duval, Ishan Misra, Piotr Bojanowski, Pascal Vincent, Michael Rabbat, Yann LeCun, Nicolas Ballas机构: Meta AI (FAIR),McGill University,Mila, Quebec AI Institute,New York University日期: 2023-01-19引用次数: 448
摘要
目标:
通过无手工设计的数据增强方法学习具有高度语义性的,并且不需要在下游任务上进行大量微调的图像表示。
方法:
提出了图像基础的联合嵌入预测架构(I-JEPA),一种自监督学习的非生成性方法,核心思想是从单个上下文块 ...
JS图片编辑工具对比分析
1 编辑工具对比:Toast UI vs.
Fabric.js
选对工具可以显著降低开发成本。本次对比的是两个具有代表性的图像处理方案:toast-ui.vue-image-editor
和
fabric.js。一个是高度封装的图片编辑器组件,另一个是灵活自由的
Canvas 图形库,适用场景和使用方式截然不同。
1.1 个人使用体验简述
我在实际项目中分别集成过这两个工具,有感于它们的差异,也踩过不少坑,以下是基于真实使用体验的总结。
1.2 Fabric.js
1.2.1 优点
完全自由、可定制性强,适合打造个性化图形编辑器或交互工具。
丰富的图形 API 支持各种对象的创建与变换。
适合深度控制图层、交互、动画等底层细节。
1.2.2 缺点
版本跨度大,1.x 和 4.x 的 API
差异明显,社区示例常无法直接套用。
不包含图像编辑的 UI,常见功能如亮度、裁剪都需自己搭界面和逻辑。
图像状态(尺寸、缩放、导出像素密度等)需手动管理。
导出图片需特别注意分辨率设置,否则容易失真。
剪切、图层控制底层操作复杂,容易被坐标系统绕晕。
调试成本高,一个简单功能经常需要翻文档、试 ...
海南椰子鸡的做法
材料
煮料:半只大鸡、一个椰子、1L 纯椰子水、500ml
水、适量蔬菜、葱、大枣、盐。
蘸料:香菜、香葱、小米辣、蒜泥、海天海鲜捞汁、小青柠、沙姜。
做法
将所有煮料放入锅中,加入水后大火煮沸,撇去浮沫,再小火煮 30
分钟。蔬菜可视情况加入,类似涮火锅。
注意事项
鸡肉切块并洗净。
建议使用不易煮烂且味道清淡的蔬菜,如荸荠、玉米笋。
海天海鲜捞汁已含果汁及调味料,可以省略小青柠。
煮鸡时少加盐,让汤呈现自然鲜甜,用蘸料调味。
水煎饺制作
面水比例
淀粉:面:油:水=1:1:2:20
(用电饼铛,20 个饺子,约 150ml 水)
步骤
锅里放油
小火煎饺子到微黄:90 秒
加面水盖盖,焖 3-5 分钟
开盖转中火,收干水
注意
用电饼铛几乎不会失手
|400
参考
视频:https://haokan.baidu.com/v?pd=wisenatural&vid=6790299808732167073
玉米面发糕
1 实验一
1.1 用料
玉米面 250g
白面 250g
开水 250ml
牛奶 100ml
鸡蛋两个
干酵母 5g
枣:适量
1.2 做法
把 250 开水倒入 250 克玉米面,烫面,然后晾凉
再加入白面、干酵母、鸡蛋、牛奶,和成面团,
放入模具,加枣
放 30-40 度发面 1 小时
凉水上锅,大火,水开后蒸 25-30 分钟
关火后闷 2-3 分钟
1.3 效果
中间有点粘
可能原因:
放了鸡蛋
中间火开小了
太厚
用蛋糕模具不透气
1.4 参考
https://haokan.baidu.com/v?pd=wisenatural&vid=11253467882059041522
2 实验二
2.1 用料
玉米面 100g
白面 100g
牛奶 150ml
干酵母 3g
泡打粉 3g
细砂糖 15g
枣:适量
2.2 做法
面粉、玉米面、泡打粉、糖,酵母混合均匀
将牛奶倒入面粉中,揉成面团
放入模具,30-40 发酵 1 小时,加枣
凉水上锅,大火,水开后蒸 25-30 分钟
关火后闷 2-3 分钟
2.3 效果
相比之前的,中间不粘,原因 ...
自制小青柠汁三种方法
山姆小青柠汁
将 100 克小青柠、80 克糖和 1L 水(700ml 水搅打,300ml
加冰)。去核后,用破壁机果汁模式搅打 5
秒(若无破壁机,打碎后需过滤)。
简易小青柠汁
切成两半,用果汁棒捶打:10 个小青柠加 600ml 水。
小青柠红茶
手打小青柠(或香水柠檬)搭配红茶、冰糖和冰块,即成柠檬茶。
说明
饮用时可选择代糖,无热量负担。
参考
感觉山姆再也赚不到我的钱!自制小青柠汁(7分糖版)
ExmemoTools插件:结合Obsidian与大语言模型的新体验
1 引入
今天和大家分享一个我自己制作的小工具,其中包含我认为非常实用、但在现有工具中找不到的功能。它的核心理念是更好地将自然语言大模型与
Obsidian 结合,同时还能相对节省调用成本。
在 Obsidan
中写文章常常会让大模型帮助修改文字,比如:润色、翻译、改错。
起初,我将需要处理的文本复制粘贴到大模型的聊天界面中,再加上提示词,得到模型的回应后,再将内容粘回到
Obsidian。
大约一年前,我开始使用 Obsidian 的 Text Generator
插件,把常用的提示词写入模板中,在需要的时候选择模板。不过也遇到了一些问题:有些模板需要经常调整,而有些操作并不在现有模板中,也不属于常见问题。每次修改模板非常麻烦,而且模板数量众多,每次定位模板也很容易打断思路。
于是,就想能不能直接输入提示词,并记忆使用过的提示词,并将高频使用和最近使用的提示词排列在最前面。这样一来,无需鼠标操作,只需在键盘上敲击两三个按键,就可以调用大模型了。
进而,想到利用大模型来生成文章的标签和摘要,将文章移动到合适的目录,让大模型帮我们做些事务性工作,也能很好的提升效率,于是把它们整合成一个工 ...