akarshkumar0101/fer

master BranchesTags 跳转到文件 代码

文件夹和文件

名称| 名称| 最后提交消息| 最后提交日期
---|---|---|---

最新提交

历史

3 次提交
assets| assets
data| data
picbreeder_genomes| picbreeder_genomes
src| src
.gitignore| .gitignore
LICENSE| LICENSE
README.md| README.md
requirements.txt| requirements.txt
查看所有文件

仓库文件导航

Teaser Figure

The Fractured Entangled Representation Hypothesis

📝Paper PDF Open In Colab Akarsh Kumar1, Jeff Clune2,3, Joel Lehman4, Kenneth O. Stanley5 1MIT, 2University of British Columbia, 3Vector Institute, 4University of Oxford, 5Lila Sciences

摘要

现代AI的许多兴奋之处都源于对现有系统进行扩展可以带来更好性能的观察。但是,更好的性能是否一定意味着更好的内部表征?虽然表征乐观主义者认为这是必然的,但本文对这种观点提出了挑战。我们将通过开放式搜索过程演化的神经网络与通过传统的随机梯度下降 (SGD) 训练的网络在生成单个图像的简单任务上进行比较。这种最小设置提供了一个独特的优势:每个隐藏神经元的完整功能行为都可以轻松地可视化为图像,从而揭示网络的输出行为如何在内部逐个神经元地构建。结果令人震惊:虽然两个网络都产生相同的输出行为,但它们的内部表征却截然不同。经过 SGD 训练的网络表现出一种我们称之为 fractured entangled representation (FER) 的无序形式。有趣的是,进化后的网络在很大程度上缺乏 FER,甚至接近于 unified factored representation (UFR)。在大型模型中,FER 可能会降低模型的核心能力,例如泛化、创造力和(持续)学习。因此,理解和减轻 FER 对于表征学习的未来至关重要。

更多数据和可视化

fmaps_576_pb.png fmaps_576_sgd_pb.png butterfly_sweeps_teaser.png apple_sweeps_teaser.png 这里是论文中的所有补充数据。

中间特征图:

所有权重扫描:

论文中选择的权重扫描:

其他资源

论文中的所有其他重要资源都可以在 ./assets/ 中找到。

代码

该仓库包含以下代码:

Google Colab

为了快速开始,请在 Google Colab 中打开 src/fer.ipynbOpen In Colab

本地运行

要在本地运行此项目,可以先克隆此仓库。

git clone https://github.com/akarshkumar0101/fer

然后,使用 conda 设置 Python 环境:

conda create --name=fer python=3.10.16 --yes
conda activate fer

现在您可以安装这些库。 版本控制需要非常具体。 但是,如果您不需要训练 SGD 网络来使用结果; 在这种情况下,您可以按照官方指南简单地安装 jax 的 CPU 版本。

python -m pip install jax==0.4.28 jaxlib==0.4.28+cuda12.cudnn89 -f https://storage.googleapis.com/jax-releases/jax_cuda_releases.html --no-cache-dir
python -m pip install flax==0.10.2 evosax==0.1.6 orbax-checkpoint==0.11.0 optax==0.2.4 --no-deps

然后,安装所有其他必要的 Python 库:

python -m pip install -r requirements.txt

现在您可以运行 notebook src/fer.ipynb,该 notebook 快速涵盖了您需要的一切。 但是,以下是有关文件结构的一些其他详细信息:

联系方式

如果您想访问更多用于研究的 Picbreeder 基因组,请通过 akarshkumar0101@gmail.com 与我们联系。 fmaps_576_pb.png

Bibtex 引用

要引用我们的工作,请使用以下代码:

@article{kumar2025fractured,
 title = {Questioning Representational Optimism in Deep Learning: The Fractured Entangled Representation Hypothesis},
 author = {Akarsh Kumar and Jeff Clune and Joel Lehman and Kenneth O. Stanley},
 year = {2025},
 url = {https://arxiv.org/abs/2505.11581}
}

关于

Code for the Fractured Entangled Representation Hypothesis position paper!

资源

Readme

License

Apache-2.0 license Activity

Stars

10 stars

Watchers

2 watching

Forks

2 forks Report repository

Releases

No releases published

Packages 0

No packages published

语言

页脚

© 2025 GitHub, Inc.

页脚导航

You can’t perform that action at this time.