吉林大学本硕校友、中国科学院神经科学研究所博士毕业生、目前在美国霍华德·休斯医学研究所珍妮莉亚研究园从事博士后研究的钟林,一直以来深深着迷于大脑的复杂性,后来他发现只有研究机器学习才能弄明白更多关于大脑认知功能的问题 [1]。正因此,他来到了上述珍妮莉亚研究园做博士后研究。而就在 6 月 18 日,由他担任第一作者和共同通讯作者的论文发在Nature[2]。 研究中,钟林和所在团队在小鼠学习多项任务的过程中,以及在无奖励地接触相同刺激的过程中,记录了小鼠初级视觉皮层和高级视觉区域(HVAs,higher visual areas)中数量多达 90,000 个的神经元群体活动。 与先前的研究类似,研究团队发现执行任务的小鼠的神经变化与其行为学习相关。然而,这些神经变化大多是在无奖励暴露的小鼠身上复制的,这表明这些变化实际上是由于无监督学习造成的。其中,神经可塑性在内侧高级视觉区域表现得最强,并且遵循视觉学习规则,而非遵循空间学习规则。 在执行任务的小鼠中,研究团队在小鼠的前部高级视觉区域发现了奖励预测信号的递增现象,这可能与监督学习有关。依托这一神经科学结果,研究团队预测无监督学习可能会加速后续的任务学习。 研究团队在论文中写道:在学习相关任务之后,对于小鼠视觉皮层中的大部分神经可塑性来说,其在无监督暴露于相同视觉刺激的小鼠中得到了复制。 而所发现唯一的例外存在于前视觉区域,该区域编码了可能用于监督学习的独特任务信号。为此,研究团队在实验中探究了在有监督学习和无监督学习的作用下,小鼠在学习发生前后多个视觉计算过程所呈现出的不同表现。 具体来说,研究团队设计了一项视觉辨别任务,让头部固定的小鼠在线性虚拟现实通道中奔跑。小鼠需要区分两条通道的视觉纹理模式,与此同时,这些通道以伪随机顺序重复出现。每条通道中的视觉图案均取自自然纹理的大尺寸照片,并以“冻结”的裁剪方式获得。为了简单起见,研究团队将刺激表示为“叶子”和“圆圈”。 针对视觉刺激,研究团队在不同类别间进行了空间频率匹配,以便鼓励小鼠在辨别过程中使用更加高阶的视觉特征。在每次实验之中,声音提示会随机地出现在通道内的任意位置,并且仅在奖励试验阶段小鼠给出正确响应后才会提供水源。 经过大约 2 周的训练,小鼠会在奖励通道中表现出选择性舔舐行为,这种舔舐发生在奖励释放之前的预期阶段。在学习阶段结束之后,研究团队引入了无奖励测试刺激物“leaf2”和“circle2”,这两个刺激物源自相同照片的不同固定裁剪区域。 随后,研究团队继续使用无奖励的“leaf2”进行训练,直到小鼠停止针对这一刺激做出舔舐行为。此时,研究团队引入了另一个测试刺激“leaf3”以及“leaf1”的空间随机排列版本。结果发现,无监督组的小鼠也会在相同通道中奔跑相似的时间,但是不会获得饮水奖励,也不受到饮水限制。 研究团队还对另一组小鼠进行了研究,这些小鼠在墙壁上带有光栅的虚拟现实通道中奔跑。需要说明的是,他们仅将这些小鼠作为对照组,以用于展示单纯暴露于虚拟现实环境的效果。为了确保所有小鼠均能获得一致的视觉体验,研究团队设定了虚拟现实系统的运行规则:当小鼠奔跑速度超过阈值时,系统保持以固定速度运行的状态;当小鼠奔跑速度低于阈值时,则会暂停虚拟场景的移动。学习前后的总体奔跑速度相似,任务组和无监督组之间的总体奔跑速度也相似。 需要说明的是,研究团队仅将小鼠运动期间的时间点纳入分析,由此排除了实验小鼠通过停止奔跑以便获取水奖励的时间段。 在小鼠学习的前后,他们使用双光子介观显微镜同时记录了多个视觉区域的大量神经群体活动,并针对这些数据运行了 Suite2p 程序,从而能在每次记录中获取 20,547 至 89,577 个神经元的活动轨迹。 研究团队针对每只小鼠的神经元计算了选择性指数 d′,该指数的计算基于以下数据:在不同通道的多次试验中,将小鼠处于奔跑状态时的神经元反应分布进行汇总,并忽略空间位置差异。其中,d′ 值相对较高的神经元,在 leaf1 或 circle1 通道内的某些位置有着强烈反应。 为了确定这些具有选择性反应的神经元在小鼠脑组织中的具体分布位置,研究团队通过将每次实验记录与预先计算的视觉皮层图谱进行空间校准后,生成了能够反映神经元位置的二维分布直方图。借此发现,小鼠在学习之后内侧视觉区域出现了许多选择性神经元。 其中,在任务组和无监督组中,内侧视觉区的区域均显示出对自然图像神经选择性的相似变化;而在虚拟现实中暴露于光栅刺激的小鼠组则没有出现这种变化。实验期间,研究团队没有观察到外侧区域的变化,而前部区域仅仅在监督条件下受到调节。 与此同时,他们还在初级视觉皮层观察到一些可塑性变化。具体来说:在无监督组中,初级视觉皮层的内侧部分表现出选择性的小幅下降;当按照刺激类型区分时,也能观察到选择性上的细微变化。 然而,具有选择性的初级视皮层神经元的总体比例并未发生显著变化,这与之前一些研究的既有相似之处也有不同之处。因此,对于神经可塑性在视觉区域的分布来说,大多不依赖于任务反馈或监督。 需要注意的是,任务组小鼠还必须学会获取水分,以及理解“水、刺激信号、通道位置与声音提示”之间的关联关系。小鼠们在奖励通道中也有着不同的表现,比如有的会在通道中停下、喝水,然后重新开始奔跑。 尽管在实验中,小鼠的表现存在种种差异,但是这些脑区的神经可塑性变化模式与无监督学习组高度相似。这一结果表明,这些区域内的可塑性主要源自小鼠对于刺激本身的直接响应,而非其他干扰因素的影响。 为了测试小鼠在无监督训练之后在神经可塑性的潜在功能,研究团队先是假设这种可塑性有望让动物更快地学习后续任务,即类似于无监督预训练帮助人工神经网络更快地学习监督任务。 基于此,研究团队针对三组小鼠进行了一项行为研究。第一组的“无预训练”小鼠接受了与上述任务小鼠类似的训练,而第二组的“无监督预训练”小鼠接受了 10 天的无奖励虚拟现实跑步。第三组小鼠的设置与第二组小鼠基本相同,唯一区别在于虚拟现实预训练阶段使用的刺激是光栅图案而非自然纹理。 为了简化奖励学习任务,研究团队采用了以下两种方式:首先,将奖励投放限制在奖励通道的后半段即限制在奖励区;其次,取消了声音提示。 与此同时,研究团队还纳入了一天带有被动奖励的初始训练,以便鼓励小鼠开始学习。结果发现,针对自然纹理进行无监督预训练的小鼠通常能够更快地完成这项任务。例如,小鼠在任务训练的第一天开始时,会在两条通道中无差别地舔舐,但在经过大约 10 次试验之后,它就停止了在无奖励通道中的舔舐行为。训练到第 5 天的时候,这只小鼠仅在奖励区的起始位置有选择性地进行舔舐。相比之下,未进行预训练或在光栅通道上进行预训练的小鼠在主动训练的第一天没有能够学会区分两条通道。 5 天后,所有三组小鼠都具备了很高的辨别能力,但是第二组“无监督预训练”的小鼠学习速度更快。此外,小鼠学习能力的提升大多发生在单个训练阶段内。 研究团队表示,经过预训练的小鼠的辨别能力能够得到提升,并非因为任务学习过程中的行为差异:所有三个组的小鼠在两条通道中的舔舐位置相似,且进行的试验次数也相近。 总的来说,本次研究证明对于皮质视觉区域的神经表征,无监督的预训练会带来实质性影响,并能帮助小鼠更快地学习监督任务。 无监督可塑性的主要区域可能是内侧高级视觉皮层,因为这些区域所包含的表征能够强烈地区分所学习到的刺激,并且无论小鼠是否经过任务训练都会出现。尽管如此,哪怕在选择性神经元的数量并未增加的情况下,小鼠在学习后其所有视觉区域都表现出了一些调谐上的变化。 最后,刺激的新颖性主要体现在初级视觉皮层和外侧高级视觉区域的神经元反应中。研究团队表示,这一研究结果可能与其他关于感觉皮层神经可塑性的报道有关。 在视觉皮层中,学习可导致更多神经元能够区分已学习的刺激、能更好地分辨刺激的神经元或对已学习刺激反应更强烈的神经元;学习还能为神经元的视觉调谐增加情境依赖性,并且可使初级视觉皮层中的刺激表征正交化。这类变化通常被解释为任务学习的结果,因为它们与任务表现密切相关。 然而,研究团队的研究结果表明,这些变化也可能在没有任务训练的情况下发生。具体到初级视觉皮层,包括本次成果在内的许多研究都已表明其在选择性和调谐方面存在变化,但部分研究也显示选择性神经元的数量有所增加,而包含本次研究在内的目前已有研究则并未观察到这一现象。这种差异可能源于实验任务的不同,或是由刺激响应的测量方式差异所导致。 与此同时,本次研究结果也可以与海马体中的研究结果进行比较。尽管研究团队已经表明皮层表征在本质上是视觉的而非空间的,但海马体的表征仍有可能从其输入中继承一些视觉特性。因此,进一步区分同一回路中的空间学习和视觉学习可能是未来研究的一个有前景的方向。另一个颇具前景的研究方向是:为本次观察到的神经变化寻找生理学基础,并将其与经典学习法则或新规则相关联。与此同时,还可以将无监督可塑性与无监督学习的经典理论和模型,以及自监督学习等方法联系起来。
牛爷爷大战小丽是谁画的更让人难以接受的是,学校甚至不允许学生带水果等零食入校,在学生们青春活泼、需要多样营养补充的年纪,这样的规定显得有些不近人情。不仅如此,资江中学还采取了每月强制扣取700元餐食费的措施,无论学生是否在食堂吃饭,这笔费用都会从学生的账户中扣除。这一系列规定背后,似乎隐藏着不为人知的利益链条。参考北京站的培训内容,预计本次成都站也将提供一系列精英教练专业教学,涉及“SU7深度定制理论课”、“加速/制动/紧急变线实操课”、“绕桩练习实操课”、“低附着路面驾驶练习实操课”、“金卡纳练习实操课”等。牛爷爷大战小丽是谁画的日本mv与欧美mv的区别报道称,卢宁可能在这个夏季转会窗口离开皇马。由于库尔图瓦在伯纳乌的主力位置稳固,而卢宁希望获得更多出场机会。他目前收到了来自欧洲多家俱乐部的邀请,但他的下一个目的地很可能是西甲升班马奥维耶多。该媒体报道称从供应链消息称,苹果公司正评估乐尔幸半导体(LX Semicon)的显示驱动芯片(Display Driver IC,DDI),而该 DDI 采用了 LG Innotek 的覆晶薄膜封装(chip-on-film,CoF)技术,并会在本月公布评估结果。
20250819 🍆 牛爷爷大战小丽是谁画的成员B: 或者他们正在基于真实数据进行强化学习。我认为在那篇论文中,他们也尝试了针对概率路线图(PRM)进行强化学习。是的,有趣的是,为什么这没有产生我们在R1中所看到的相同结果,当他们在DeepSeek数学时代进行这项研究时。你认为是什么原因?所以,有一些关于此的有趣工作,比如尝试理解这一点。看起来似乎与基础模型的能力有关,比如预训练数据中的某些东西,或者模型本身已经足够好,基础模型会进行一定程度的回溯。也许不是很频繁,百分之一的样本或者类似的情况。但这已经足够了,一旦你进行大量的强化学习,它就会捕捉到这些行为并放大它们。所以可能仅仅是因为基础模型已经足够好,以至于它们可以学习这些有趣的行为。少女自愈骑枕头视频高清在线观看物理学家有个梦想,希望AI能发现新的物理定律。理论上把所有实验数据喂进去,它能找到我们以前没注意到的模式。但现有AI甚至在从数据中发现已知定律方面,也还很吃力。或者说,如果它能做出这些成果,人们也会怀疑是否只是因为在训练数据中某处隐含地提到过某条定律。
📸 解怀军记者 苏清镇 摄
20250819 🔞 牛爷爷大战小丽是谁画的范尼斯特鲁伊在俱乐部的困难时期来到球队。从他上任的2024年11月,他展现了自己的职业精神以及他对俱乐部做出的承诺。其中包括了,他帮助多名俱乐部青训球员融入了一线队。俱乐部所有人员,对范尼在俱乐部期间的努力与付出表示感谢与尊重。我们祝愿范尼的未来一切顺利。鲁鲁影院免费观看电视剧电影窝窝特雷弗顿进一步提到,政策与情报之间始终存在张力:决策者或许想要采取某些行动,但情报机构可能会指出——这些行动缺乏充分依据,或根本没有正当理由。这种矛盾本就根植于体制之中。“但本次事件尤为特殊:总统公开否定本国情报机构的判断堪称史无前例。我担心,随着时间的推移,本届政府不仅会像这次一样无视情报,还会试图操纵情报来佐证其既定政策——这种政治化倾向始终存在重大隐患,而当前尤其危险,因为特朗普似乎把情报机构当作政治工具。”
📸 张坚志记者 马宝石 摄
👙 这非常重要,我们有一个冠军奖杯值得争取。在这个赛季里,我们有过好的时刻,也有过糟糕的时刻,还有我们犯错的时候。我满怀期待,既然有一座冠军奖杯可以争取,我们就会竭尽全力去赢得它。公媳孽缘1-20更新时间