跳转到内容

维基百科:机器人/申请

维基百科,自由的百科全书

在未获批准之前就使用机器人可能招致封禁。

You may be blocked for running a bot without approval.

  • zh: 本维基允许使用全域机器人。您可向监管员申请使用此类机器人的权限;而其他机器人的申请则须于下方提出(新申请请置于“请求测试许可”段落最底)。如果你不熟识编程,请考虑由他人代为运作机器人
  • en: This wiki conforms to the standard bot policy, and allows global bots. You can ask for permission of such bots from stewards. Other bots must be requested below. Please add your request at the bottom of section "請求測試許可".
# bot 机器人申请 进度 💬 👥 🙋 最新发言 🕒 (UTC+8) BAG 🕒 (UTC+8)
1 Shio-bot 2
状态 新申请
2 2 0xDeadbeef 2025-04-11 21:20 0xDeadbeef 2025-04-11 21:20
2 1F616EMO-bot
状态 新申请
5 2 0xDeadbeef 2025-04-06 15:46 0xDeadbeef 2025-04-06 15:46
3 YFdyh-bot 4
状态 测试中
9 4 0xDeadbeef 2025-04-06 14:14 0xDeadbeef 2025-04-06 14:14
4 LuciferianBot 8
状态 测试中
2 2 0xDeadbeef 2025-04-06 11:28 0xDeadbeef 2025-04-06 11:28
5 Shio-bot
状态 测试中
16 5 0xDeadbeef 2025-05-08 21:28 0xDeadbeef 2025-05-08 21:28
6 YFdyh-bot 3
状态 测试已完成
11 4 0xDeadbeef 2025-04-11 21:34 0xDeadbeef 2025-04-11 21:34
发言更新图例
  • 最近一小时内
  • 最近一日内
  • 一周内
  • 一个月内
  • 逾一个月
特殊状态
已移动至其他页面
或完成讨论之议题
手动设定
当列表出现异常时,
请先检查设定是否有误

请求测试许可

[编辑]
示例编辑。受影响页面数量为估算,实际数量应该比这个小很多。Iming 彼女の爱は、甘くて痛い。 2024年11月18日 (一) 12:50 (UTC)[回复]
阅读了一下之前讨论,以及作业请求,Wikipedia:机器人/作业请求#请求更改涉及全国重点文物保护单位的内容
--beef [talk] 2025年4月11日 (五) 13:20 (UTC)[回复]

(~)补充:虽然现存大量直接重定向至“XX年中国”的条目,惟根据MOS:中国,“在1949年之后的相关条目中,应尽量使用中华人民共和国和中华民国等全称”,故“XX年中国”不应直接重定向。另本脚本每一次编辑都会进行人工审核,形同小工具;惟机器人方针也有规定批量创建条目需要申请(虽然该部似乎只规范Lsjbot这类内容页面建立机器人),且为免冲刷近期变更,遂申请机器人权限。

由于此脚本在低频操作下等同小工具,先前已经在主账户上完成测试:

  1. 1951年中国(存在错误,脚本已经修正)、1951年中国(重定向)
  2. 1952年中国1952年中国(重定向,最后一次主动建立重定向)
  3. 1953年中国
  4. 1954年中国
  5. 1995年中国1995年中国(原先存在的繁简重定向,故覆盖之)
  6. 1998年中国(香港回归后,澳门回归前)
  7. 2000年中国(两地均已回归)
  8. 1960年中国
  9. 1961年中国记录档编辑(换行出错,脚本已修复,因修复简单而不计划特意测试)

请复核上述编辑。另脚本判断逻辑如下:

  1. 若繁简标题任一页面存在消歧义,则假定相关条目已经处理,不进行编辑;
  2. 同理,若任一页面不是消歧义也不是重定向,则跳过;
  3. 若其中一个页面不存在而另一个是重定向,则覆盖现有重定向;
  4. 若两者均存在且为重定向,则覆盖繁体页面,并更改简体页面的重定向目标。

1F616EMO喵留言回复请ping2025年3月15日 (六) 15:22 (UTC)[回复]

目前机器人配置:
WIKI_USERNAME=1F616EMO-bot@[REDACTED]
WIKI_BOTPASSWORD=[REDACTED]

WIKI_LOG_PAGE=User:1F616EMO-bot/log/1

EDIT_LOWER_BOUND=1950
EDIT_UPPER_BOUND=2020
1F616EMO喵留言回复请ping2025年3月15日 (六) 15:30 (UTC)[回复]
我比较希望能先有社群讨论说明这个任务可行。--beef [talk] 2025年4月6日 (日) 03:53 (UTC)[回复]
稍后处理。另(?)疑问:若此脚本作为小工具运行,是否确实需要申请?--1F616EMO喵留言回复请ping2025年4月6日 (日) 05:50 (UTC)[回复]
界面不多,说实话可在主帐号自己慢慢建立,但是还是需要取得社群共识。--beef [talk] 2025年4月6日 (日) 07:46 (UTC)[回复]

正在测试的机器人

[编辑]
  • 状态 测试中
  • 操作者:YFdyh000留言
  • 提请时间:2024年9月22日 (日) 01:01 (UTC)
  • 自动化程度:全自动
  • 编程语言pywikibot
  • 用途:清理脚注中与Cite模板archive参数重复的Wayback模板。
  • 讨论内容连结:Wikipedia:机器人/作业请求#清理重复Wayback模板
  • 源代码连结:[1]
  • 编辑时段及频率:服务器maxlag控制,一次性
  • 受影响页面:38.6万个条目中的约8800个
  • 遵守机器人规范
  • 已有机器人权限:
  • 例子大例子。因例子2,计划忽略archive-url与存档模板网址存在的https差异。脚本不比对存档模板的date参数。--YFdyh000留言2024年9月22日 (日) 01:01 (UTC)[回复]
    ( π )题外话,看第一个例子,发现了User:InternetArchiveBot的一个问题,不能识别{{Internetquelle}}(德语维基版的{{cite}}系列模板),既重复了Wayback,又在外面添加了一个{{cite web}}模板。--Kethyga留言2024年9月23日 (一) 13:21 (UTC)[回复]
    这可能需要与@Cyberpower678本人反映?—— Eric Liu 創造は生命(留言留名学生会 2024年9月28日 (六) 18:14 (UTC)[回复]
    Kethyga之前已在meta:User_talk:InternetArchiveBot#duplicate_wayback_and_cite_template_in_Chinese_wikipedia中反映,尚未获得回复。--YFdyh000留言2024年9月28日 (六) 19:06 (UTC)[回复]
  • {{BAGAssistanceNeeded}}
  • @YFdyh000 使用regex匹配wikitext可能出错,可否可以使用mwparserfromhell或parsoid?beef [talk] 2025年4月5日 (六) 05:58 (UTC)[回复]
    感觉概率不太大。尝试改成mwparserfromhell了,没大规模测试。--YFdyh000留言2025年4月6日 (日) 01:37 (UTC)[回复]
    @YFdyh000: 重新阅读了一下源码,我认为 urlTohttps(cite_url) == urlTohttps(wayback_url) 可能存在问题。这里比对的URL是被存档的URL而不是整体存档的URL,而不同时间保存的不同存档可能在内容上有差异,无法确保每次删除的是应该删除的,我建议比对存档时间日期吻合再当作重复来删除。尤其是被保存的URL的一个是http一个是https,那么保存内容就有可能出现差异。在这方面我建议你去写一些程序去判断有多少是无法直接被当作重复而删除的,然后再看看对于那些情况半自动(带人工)编辑是否足够。
    以上问题解决后, 批准测试运作(50次编辑)--beef [talk] 2025年4月6日 (日) 03:15 (UTC)[回复]
    设计缘于重复的Wayback模板是机器人无意识误加入的,我假定了cite及其参数更早,更可能人工填入和正确,以及尽早尽快清理。必需比对存档日期吗,有可能做但复核及二次编辑工作量似将增加不少,Webarchive有archive.today等格式需兼容。http/https的不同是有可能的,但是否要半人工,还没想好。--YFdyh000留言2025年4月6日 (日) 05:46 (UTC)[回复]
    假定了cite及其参数更早,更可能人工填入和正确 那就先测试一下吧。--beef [talk] 2025年4月6日 (日) 06:14 (UTC)[回复]

{{BAG assistance needed}}--西 2025年3月9日 (日) 04:38 (UTC)[回复]

  • @LuciferianThomas 这个有人用吗。。我唯一对于代码的意见是判断如果与当前文本相同(不用更新)的话则不用编辑,这样就不用每10分钟就编辑了,我没看见代码里面有这样做,如果之后要使用~~~~~代表更新时间的话则必须做一个判断(为原bot的判断)
  • 这个问题修好之后(或者向我指出此问题不存在),按DRN有第一个讨论串起, 批准测试运作(30次编辑或7日),哪一个先到(7天或30个编辑)则为结束。beef [talk] 2025年4月6日 (日) 03:28 (UTC)[回复]
L29:redirect也可以确立重新导向。--Hamish T 2024年10月31日 (四) 14:38 (UTC)[回复]
感谢建议,已修改。--Yiming / Praise and glory be to the Machine God! 2024年10月31日 (四) 17:06 (UTC)[回复]
{{BAG assistance needed}}Yiming / Praise and glory be to the Machine God! 2024年11月3日 (日) 10:00 (UTC)[回复]
( π )题外话:能否带tag?触发机器人这个任务的编辑(i.e.,用户修改有繁简差异的重定向)可能需要检查。 ——魔琴身份声明 留言 贡献 新手2023 2024年11月8日 (五) 02:53 (UTC)[回复]
@魔琴可以,但需要管理员协助创建相应标签。--Iming 糖少女以为食 2024年11月8日 (五) 03:07 (UTC)[回复]
我记得pywikibot自带有个脚本就可以做这个事?--百無一用是書生 () 2025年1月4日 (六) 11:23 (UTC)[回复]
@Shizhao我没记错的话那个似乎是用来修复双重重定向或受损重定向的,不符合此任务的用途。此任务用于在确认到修改重定向后,将该重定向页面对应的繁体/简体重定向页面重定向到新的重定向目标。--Iming 彼女の爱は、甘くて痛い。 2025年1月4日 (六) 11:43 (UTC)[回复]
@Iming 此申请与下方申请的源代码链接已失效?--beef [talk] 2025年4月4日 (五) 04:53 (UTC)[回复]
源码发布了at我 beef [talk] 2025年4月6日 (日) 03:31 (UTC)[回复]
@0xDeadbeef:链接已更新。同时补充说明一些内容,机器人只会处理简繁差异,不会处理地区词导致的问题,同时有关魔琴在上方提出的问题,我认为没有必要单独添加tag,因为此机器人只会因为此任务而修改重定向,所以可以通过在机器人用户贡献页面限定tag来查看相关改动,日后如有其他需要再考虑为编辑添加tag。下方任务改为使用AWB进行,稍后修改。谢谢。Iming 彼女の爱は、甘くて痛い。 2025年4月6日 (日) 13:40 (UTC)[回复]
大概了解这个机器人是什么意思了。目前鼠标指针重定向至指针 (用户界面)。如果同时存在鼠标指针这样的页面,则修改前者的重定向目标之后则bot会跟着去修改后者的重定向目标。有一下两点需要注意:
  1. Bot应该忽略自己作出的编辑,以免进入死循环
  2. 应先统计全站有这样的情况重定向标题有多少,而且目前软件、内链等不需要同时简体繁体标题都存在就可以工作?所以如果发现这样重复的情况是不是应该先提删?
--beef [talk] 2025年4月11日 (五) 12:59 (UTC)[回复]
感谢您的意见:
  1. 代码已修复,位于L51处。
  2. 经统计,共有75815例。我个人更倾向于保留,以免未来被错误重建。同时其他编者可以参考机器人编辑日志,对于有需要提删的,手动提删。
--Iming 彼女の爱は、甘くて痛い。 2025年4月24日 (四) 17:30 (UTC)[回复]
注:此任务正于Wikipedia:互助客栈/技术#原提案:目前和将来出现的2条仅为简繁差异的重新导向,(A)使用机器人维护?(B)还是删除?讨论--beef [talk] 2025年5月5日 (一) 13:27 (UTC)[回复]
@0xDeadbeef,按现有讨论,社群对于使用机器人并无异议,目前的讨论点仅在未来如何对待新建的类似重定向,和本申请无关。此外,上文所提及的“75815例”,请见此处]。谢谢。Iming 彼女の爱は、甘くて痛い。 2025年5月8日 (四) 13:25 (UTC)[回复]
从机器人第一个编辑计起, 批准测试运作(30次编辑或30日),哪一个先到(30日或30个编辑)则为结束。--beef [talk] 2025年5月8日 (四) 13:28 (UTC)[回复]
哦对了,记得加编辑摘要,链接这个BRFA。--beef [talk] 2025年5月8日 (四) 13:28 (UTC)[回复]

已完成测试的机器人

[编辑]

接续Help talk:引文格式1错误#新出现的引文格式1错误@Antigng所以这个批量修正是正确的吗?--Xiplus#Talk 2022年6月2日 (四) 03:51 (UTC)[回复]

(:)回应@Xiplus我记得之前在IRC跟申请者聊过......这个任务不太适合全自动,因为既有可能是{{cite web}}错用了{{cite news}},也可能是|website=错用了|newspapwer=,需要判断是哪种情况再决定如何清理。--Antigng留言2022年6月2日 (四) 04:49 (UTC)[回复]
那么YFdyh000还有打算执行此任务吗?是不是应该一律监督半自动?--Xiplus#Talk 2022年6月2日 (四) 12:48 (UTC)[回复]
与Antigng的想法不同,我认为如果是误用模板,发现的人在编辑条目时更正会比现在始终红字展示给所有读者更好,目前上千个条目多为历史遗留问题,因为以前不报错、效果相差无几。以及,随机检查来看,newspaper参数大多数为新闻机构,只是误用了cite web模板,目前亦无必要去逐一核对,错误提示避免未来增长就好。|website=新闻机构 的情况,尚未检查而暂无运行计划。此外,某些新闻网站/媒体如何归类,也并无共识。--YFdyh000留言2022年6月2日 (四) 14:35 (UTC)[回复]
我不太懂...为何cite web有newspaper参数?如果这是个支援的功能,那就不应该显示警告。--Xiplus#Talk 2022年6月19日 (日) 01:38 (UTC)[回复]
以前是支援的,但CS1模块改版期间加了限制(版本差异,引文格式1错误:periodical系列参数),对混用参数名强制显示红字警告给所有读者,而非仅仅维护性分类。因而现有警告值得快速清理,而不是拖下去等“好心人”完成逐条清理。或者,去掉该限制/警告,英文维基似乎没有此限制。--YFdyh000留言2022年6月19日 (日) 06:31 (UTC)[回复]
批准测试运作(50次编辑),先看一些范例吧。--Xiplus#Talk 2022年6月19日 (日) 06:52 (UTC)[回复]
@xiplus刚看到批准。已监看执行50条(针对乱序后列表),现有规则自动跳过86条(不适用/待改进),用时15分钟。过程中见到3例更适合web而非news:马正其高密市坊子德日建筑群——但引用即便用错cite系列,也不会有明显后果,而目前不匹配的参数会显示很丑的警告给读者。@Antigng真心不觉得这需要展示,参数相符的也不一定就用对了,包括像是网络新闻(如cnBeta)写web还是news,并没有一致观念。--YFdyh000留言2022年7月7日 (四) 02:15 (UTC)[回复]
没来的及看,先把测试执行的50条编辑链接放在这里:[2]--beef [talk] 2025年4月6日 (日) 03:57 (UTC)[回复]
@YFdyh000: 我仍然认为这里应该一律监督半自动,首先有一部分确实适用把{{cite web}}改成{{cite news}},但是也有一部分适用保留{{cite web}}但是把newspaper=改成website=,实际操作应该通过观察链接是否为新闻网站再决定是否改为{{cite news}}。不知你是否愿意将此改为监督半自动。--beef [talk] 2025年4月11日 (五) 13:30 (UTC)[回复]
另外,因为其实实际上引用格式根本没有任何区别,或许也可以提议允许{{cite web}}使用newspaper=。我看英维好像就允许这样写(有可能这些错误是因为直接从英维复制过来导致的?)。--beef [talk] 2025年4月11日 (五) 13:34 (UTC)[回复]

待存档

[编辑]

申请复核

[编辑]
提报不活跃机器人