香蕉视频在线观看一直看一直爽

欧美BT ICLR审稿集体搞笼统!评审效力写半句,还有的求ta也不审

发布日期:2024-12-06 22:26    点击次数:66

欧美BT ICLR审稿集体搞笼统!评审效力写半句,还有的求ta也不审

衡宇 发自 凹非寺欧美BT

量子位 | 公众号 QbitAI

今天,ICLR 2025的discussion phase的ddl照旧截止。回看昔日14天的探究历程,可太精彩了!

各大平台上顺手一翻即是作家们的吐槽大会,齐在尴尬这届ICLR评审的多样仙葩乱象。

比方UCSB博士生@JiachenLi11 就在推特上越过之无奈:

我收到的评审骨子,低到令东谈主担忧——其中一条评审致使话齐没说完。难谈审稿东谈主的tokens用完结吗???

△图源推友@JiachenLi11

你还真别说,他这个“tokens用完”的吐槽并不是齐东野语——

ICLR 2025的论文提交数前所未有地高,约有11000篇。

为了升迁审稿速率和质料,ICLR本年引入了AI参与审稿责任。

固然了,倒也不是单一AI,是多个AI大模子组成的Agent。

关联词,你以为审稿东谈主话不写完评审骨子就点发送,即是ICLR 2025的沿途槽点了吗?

ICLR吐槽大赏

要细数本年ICLR 2025的神奇事件,我们先从最广为东谈主知的一件提及:

[10,10,10,10]和3个poor得分并存

本年的ICLR出现了一篇4个审稿东谈主同期打出了10分的论文。

假如这个分数能保握到中稿见知,这将是近5年来,ICLR的独逐一篇满分作文。

论文题目如下图,是一个叫IC-Light(全称Imposing Consistent Light)名堂,是对于戒指图像照明的。

作家张吕敏,亦然大名鼎鼎的ControlNet的作家。

他在苏州大学拿到学士学位后,去往斯坦福读博。

IC-Light不错肤浅戒指像片主体的光源和布景,将主体、光源、布景三者赶快地交融在一张图片里。

半年前,IC-Light就在GitHub上开源,当今共6.5k星。

与此同期,ICLR 2025还出现了几篇,某一审稿东谈主给某篇论文全打1分的论文。

这里我们打断一下,了解一下ICLR的评分体系:

1分:太差了3分:拒绝5分:婉拒了哈6分:接……吧8分:经受10分:强经受

就拿其中一篇来说吧,看到这个效力给作家气的,写了一篇十几页的strong rebuttal。

那审稿东谈主为什么给东谈主家Soundness、Presentation、Contributions齐给了1分?

审稿东谈主言辞越过横暴,直呼Paper Writing is quite bad,然后还绝不客气地发问:“Is there a human author on this paper?”

审稿东谈主还暗示,(这亦然沿途最低分的最遑急小数),我们是不错判断一篇论文是东谈主写的如故AI写的,“也许您在生成文本时莫得进行基本的连贯性查验”。

作家连续输出言反正传rebuttal,并拒抗“我可真钦佩你识别AI的能力”。

作家5页回话,审稿东谈主在ddl一霎狡赖界限

一位在北大CS读博的小某书网友@Kevin 对审稿东谈主的神操作大吐苦水。

事情是这么的,ICLR不是共14天用来discussion phase嘛。

这14天里,有一位审稿东谈主5,一共对他场合团队提交的paper漠视了10个问题。

团队谨慎回复了整整五页欧美BT,审稿东谈主5已读不回。

团队屡次但愿与其探究,审稿东谈主5已读不回。

总之即是一悉数这个词石千里大海。

到了昨天,也即是discussion phase的临了一天,“审稿东谈主5一霎狡赖这个界限,并将5分改为3分”。

@Kevin越过不睬解为什么审稿东谈主这么作念的意图。

确切就,令东谈主心碎的discussion phase。

“你需要援用另一篇ICLR 2025投稿”

推友@PandaAshwinee(普林斯顿博士毕业,当今在Trails.ai从事博后责任)给看干涉的网友们画了个我方经受到的评审骨子的亮点:

你需要援用另一篇ICLR 2025的投稿。

伸开说说,即是审稿东谈主结合了ICLR 2025 openreview的另外一篇论文,暗示两个名堂高度相干,是以小哥应该援用。

然而哭啊,小哥查过了,条目被引的论文根柢不在arXiv上。

何况这不是他第一次嗅觉“天塌了”——他在评述区补充,之前他的名堂在ICML 2024被拒,主要原因亦然“与另一篇ICML 2024投稿高度一样”。

不外ICLR很快在小哥推文底下回复了,抒发时当事者席运行探望这个事儿。

“乞讨式”ICLR

前边提到的齐是审稿东谈主和作家有来有回(哪怕回得慢)的情谊battle,更有真理的事是,不管国内如故海外,好多东谈主齐把这届称为“乞讨式”ICLR。

简而言之,即是审稿东谈主一直不给评审不给分。

有东谈主上个月下旬的时间,就运行给悉数AC(区域主席)发了邮件,条目他们教导审稿东谈主回复作家。

或者至少阐明审稿东谈主们知谈我方还得干这活。

其时就有网友教导“最坏的诡计”,有的审稿东谈主会拖到临了一刻,因为他们也在为我方措辞……

竟然如斯,单看国内,昨天运行24h内倒计时了,好多作家还在恳求审稿东谈主快快评审,快快给分。

哎。

对作家的奇怪央求

在Google DeepMind责任的Ahmad Beirami(@abeirami)共享了一则音讯:

发到推特上后,有ICLR作家暗示出了狐疑:

淌若作家们写了这玩意儿,是否确切对审稿有匡助?

他以为这“可能是在奢侈时分”,因为审稿东谈主充足可能看齐不看,胜利去看paper原文。一切齐是枉费的。

不外Ahmad很快回复了这位作家:

Yes!

行为又名AC,我想确保我莫得从作家的角度遗漏任何骨子。可能会有好多变化、新效力等。我想确保我知谈在那处找到它们,以便随机变成不雅点,判断一些原始评述/关心是否适用。

取得这个呈报后,作家小哥很快意地去添加注释去了。

ICLR 2025为何这么

以上种种,仅仅全球或身在其中/或围不雅看干涉的ICLR 2025的小数点故事辛苦。

但,身为泰斗顶会,为什么会这么?

有的东谈主认为和本年的稿件数目掂量。

官方数据显现,ICLR 2025的论文提交数目达到了11,000多篇,同比增长61%。

而前年ICLR 2024组委会收到的投稿总额为7,262篇——固然了,对那时间的ICLR来说亦然不小的责任量,同比增长了47%。

本年,面临如斯宽敞的论文数目,审稿东谈主数目高达15,000多名。

这还不够,官方还引入了多个AI大模子组成的Agent来参与审稿。但它的功用不是充足替代审稿东谈主,它不会撰写审稿评述或胜利裁剪评述,而是提供配置性和可操作性的反映,匡助审稿东谈主提高审稿质料。

这个Agent针对审稿中可能存在的三类问题提供建议:

饱读舞审稿东谈主改写微辞的评述,使其对作家更具可操作性;隆起著述中可能照旧回答了审稿东谈主问题的部分;发现并处理不专科、不得当的言论。

但好多作家认为,稿件数目激增确乎加大了责任量,Agent的缓助无可厚非,但绝不是ICLR变成被看干涉的“科研春晚”的原因。

一方面,Agent漠视的建议,审稿东谈主是不错选拔给与或者忽略不管的。

另一方面,极速膨胀的审稿东谈主中,是否有东谈主并不是得当评审责任?

再一方面,为了确保审稿质料,每位审稿东谈主平中分派3篇论文,顶天了看4篇,责任量并不是超负荷现象。

除了有点衰败之外,另一个被网友们猛烈探究的点,围聚在这届ICLR的分数上。

一般来说,ICLR的传统经受率在30%足下,然后本年ICLR的名次前30%的论文,平均评分约为5.6。

前边我们先容了,6分算是一个勉拼集强的分数,属于论文被经受的边际门槛。

这就意味着“低于‘边际给与’门槛的论文将被经受”。

网友谈谈,“当会议给与变得如斯肤浅时,我们正在破损悉数这个词科学评估系统——这影响到AI有计划举座的完好性。”

在此基础上,他漠视了三点我方的想考,但愿ICLR应有更严格和自制的时事。

固然,也有另一种声息:

期待一些超等苍劲到无空不入的大模子出现,让它们充任审稿东谈主,处分上述悉数问题,以此匡助裁汰审稿的职守。

仅仅不知谈这一天什么时间会到来了。

参考结合:

[1]https://x.com/mo_danesh/status/1863964693687107823[2]https://x.com/JiachenLi11/status/1856472250636964350[3]https://x.com/Yuchenj_UW/status/1862541099136651536[4]https://x.com/abeirami/status/1863629237741064608[5]https://x.com/PandaAshwinee/status/1856384624873570749[6]https://x.com/ysu_nlp/status/1860504185583648863[7]https://openreview.net/group?id=ICLR.cc/2025/Workshop_Proposals#tab-accept

— 完 —

量子位 QbitAI · 头条号签约

忘忧草官网在线播放

关心我们欧美BT,第一时分获知前沿科技动态



相关资讯
  • 欧美BT 急性呼吸说念传染病疫情上周仍处于较高水平 中国疾控中心发布教唆

    2025年第2周(2025年1月6日—2025年1月12日)欧美BT,对天下哨点病院(不含港澳台)收罗的门急诊流感样病例和入院严重急性呼吸说念感染病例的呼吸说念样本,开展新式冠状病毒、流感病毒等10种病毒以及肺炎支原体在内的多种呼吸说念病原体检测。 检测成果显现,哨点病院门急诊流感样病例呼吸说念样本检测阳性病原体主要为...

  • 欧美BT 小米澎湃OS 小米景深壁纸

    欧美BT 欧美BT 忘忧草官网在线播放 欧美BT...

  • 欧美BT 扎哈罗娃恢复拜登终末一次大意策略演讲: 特地于“承认了好意思国在规画寻衅”

    [内行网报说念]据俄罗斯塔斯社、英国路透社等媒体报说念,距离卸任只剩一周技巧的好意思国总统拜登当地技巧周一(13日)在好意思国国务院发表了其任内终末一次大意策略演讲欧美BT,其间他谈到俄乌突破,称好意思国匡助乌克兰抵御了俄罗斯等。对此,俄罗斯大意部发言东说念主扎哈罗娃火速恢复,称拜登的言论特地于承认“好意思国对基辅的支...

  • 欧美BT 在欧洲汇市中,英镑兑欧元跌至两个半月以来的最低水平,同期兑好意思元汇率也呈现着落态势

    忘忧草官网在线播放 (原标题:在欧洲汇市中欧美BT,英镑兑欧元跌至两个半月以来的最低水平,同期兑好意思元汇率也呈现着落态势) 汇通财经APP讯—— 受英国财政可抓续性担忧抓续影响,周二英镑兑好意思元瞻望联络第六个往以前着落,兑欧元则涉及两个半月以来的最低水平。 英国政府债券的多数供应,对英国财富价钱酿成压力,同期,通胀...

  • 欧美BT 文化中国行|河北曲阳:“小院课堂”制瓷忙

    光明日报记者 耿建扩 陈元秋 光明日报通信员 姚琳欧美BT 忘忧草官网在线播放 腊月里,记者来到河北曲阳岗北村,制瓷工坊里,大伙儿传艺、学艺,忙得热气腾腾。 岗北村位于定窑国度考古行状公园隔邻。数百年来,村民以瓷为生、以瓷为业。村里有制瓷工坊70多家,以户为单元、小院为载体。 “制瓷师父在工坊或职责室里‘开课’,本村或...

撸撸射百度影音

TOP
友情链接:

Powered by 香蕉视频在线观看一直看一直爽 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024