有价值且有趣的前沿研究方向

我这个人想象力有余,行动力不足,有很多想做而未做的东西:

LLM 小说续写/生成

电影/电视剧生成

最近十几年/几十年没有什么值得称道的小说/电影/电视剧。例如武侠小说金庸之后就没有大师出现了。然而就算是大师的作品读者读起来可能也有缺憾,例如对情节/结局感到不满/意犹未尽。

然而 LLM 的出现使得计算机拥有人类可能要几十年学习训练以及天赋才拥有的知识的理解和利用能力,如果能用 LLM 使得读者就像玩游戏一样定制小说的情节发展,那将多有趣。

进一步的,图像生成模型、视频生成模型、3D 图形引擎的发展使得可以根据用户的交互和偏好,动态地生成内容。
一个有趣的例子是,例如射雕英雄传电视剧的视频数据,无需新的演员和拍摄,创作一个新的游戏,所有人物的行为用户可干涉,可以跟 LLM 结合,用户用自然语言控制剧情的发展,实现用户说出需求,虚拟演员演给你看的效果。

评论区有些同学说

不希望摄入统计学艺术品

我觉得不一定要完全由概率模型生成,可以由模型辅助人类的创造,即 Human in the loop。

人类的优势在于 idea, plot, topic,而长篇大论的写作非常累,尤其是细节:作家路遥有篇杰作叫做《早晨从中午开始》,他经常深夜文思泉涌,所以熬夜写作。我个人也有这种经历,晚上躺在床上思绪万千、想象力非常丰富。

而且现代人喜欢快节奏的知识获取(阅读),不重视细节,例如有些人半天看完一篇长篇小说。这方面 LLM 就很合适了,目前 token 数最多 32k,没法一次生成长篇小说全片,生成细节最合适不过了。

因而人机合作进行文学/艺术创造是非常高效的。

至于现代的图像生成方法如 stable diffusion 更是非常逼真,并且成本不高(普通显卡就能运行),因而我觉得当人无法分辨统计学艺术品的时候会接受它,就像现在的 singing synthesizer 一样。

消除地铁上耳边的提示音

提示音和报站音都是固定的,也就是一旦检测到比如前 0.5s 后面播放的声音的已知的,可不可以利用这个来高效消除(ANC)到达人耳的提示噪音?尤其是西安地铁上有很多无用的英语提示音。

人工视觉,以及根治屈光不正(近视)

经常说屈光不正无法根治,是这样的,变长的玻璃体很难精细地雕刻成想要的形状,而且很多时候是视网膜不可逆得受损。

现在有个有初步产品的研究方向就是通过眼神经/其他神经通路直接向大脑传送图像信号。难点在于解密视网膜光电转换的信号处理/编码方式以及眼神经信息传输的信号编码。

电子吹奏乐器

电子琴、电吉他的发明让演奏者可以自主控制音量以及音色,目前似乎没有电子吹奏乐器。

简单地思考,发明起来不难。可以在音孔附近安装压力传感器用来决定发出的音,可以测量气流量决定音量,可以测量气压来识别一些装饰音例如颤音。

1 Like

没看明白 2

等我后面再详细说说

你是住在论坛了吗 (

看电脑看累了就来转转,也不费时间

先来个开放世界 galgame

不如当一个帅现充

很多作品的意犹未尽是它的一部分,修改反而失去了它的特质

现实中能遇见的人太少了,没有什么聊得来的。我并不很喜欢人。

喜欢抽象的人,不喜欢具体的人

什么是具体?你知道你是具体的还是抽象的吗?
你了解你自己吗?你怎么阐述自己是一个具体的人呢?你说:啊我性格怎么怎么样,我喜欢什么什么,我优点缺点。。。之类云者,你也不过是在往自己身上贴更多抽象的标签。你怎么描述一个人?身份?能力?立场?只要这种抽象的标签足够多,就是具体的人吗?那么一个虚构的人物,只要对其的描述越琐碎,越具体,那么也便成了具体的人吗?
然后知道,你越了解自己是一个什么样的人,你越阐述自己,你就越抽象。那么爱具体的人,爱的究竟是什么呢?是他营造出来的这种抽象的人设,还是背后物理层面的分子原子?你该怎么去爱呢?在大脑中,具体的人,抽象的人,究竟有什么区别呢?都只不过是抽象的概念罢了。
喜欢本就是假的。喜欢具体的人还是抽象的人,没有区别,也没有意义。

1 Like

好抽象。就现实认识的人就是具体的人,人的概念和泛指就是抽象的人,这不行吗?
喜欢人,但不喜欢很多人。

不想以后只能摄入批量生产的统计学艺术品。

1 Like