五指山市网站建设_网站建设公司_Sketch_seo优化
2025/12/23 0:16:01 网站建设 项目流程

一、翻译全文

原论文标题:Duct-Taping Databases, or How to Use Fragmentary Online Data for Researching “Japanese” Videogames

Abstract
摘要

The internet provides exciting opportunities for scholars of Japanese videogames.
互联网为日本电子游戏的研究者提供了令人兴奋的机遇。

Fans from all over the world passionately collect, order, and share information about their hobby online.
来自世界各地的爱好者们在网上充满热情地收集、整理并分享关于他们爱好的信息。

In this paper, we will show how we can exploit these potentials for research on Japanese videogames.
在本文中,我们将展示如何利用这些潜力来进行日本电子游戏的研究。

We call this approach “duct-taping” databases: the integration of information from various heterogeneous, fragmentary online resources with the goal of creating a robust research dataset.
我们将这种方法称为数据库的“胶带修补术”(duct-taping):即整合来自各种异构、碎片化的在线资源,旨在创建一个稳健的研究数据集。

We will discuss the potentials and challenges of this approach and show how it allows us to better understand the historical development of Japan’s videogame production.
我们将讨论这种方法的潜力和挑战,并展示它如何让我们更好地理解日本电子游戏生产的历史发展。

1. Introduction
1. 引言

The term “Japanese videogames” is as ambiguous as it is popular.
“日本电子游戏”这一术语既流行又充满歧义。

Putting problematic essentializations of “THE Japanese game” aside, games may be labeled “Japanese” for various reasons: because they have been produced in Japan; because they are sold or popular in Japan; or because their content or aesthetics are perceived as Japanese or ascribed to Japan in some way (see Goto-Jones 2015).
撇开对“所谓日本游戏”的有问题的本质化定义不谈,游戏可能出于各种原因被贴上“日本”的标签:因为它们在日本生产;因为它们在日本销售或流行;或者因为它们的内容或美学被感知为日本风格,或以某种方式归属于日本(参见 Goto-Jones 2015)。

Each of these categories is vague in one way or another.
这些类别中的每一个都在某种程度上是模糊的。

Regarding the framing of Japanese games as games produced in Japan, Mia Consalvo remarks:
关于将日本游戏界定为在日本生产的游戏,米娅·康萨沃(Mia Consalvo)评论道:

It no longer makes sense (if it ever did) to talk about “the Japanese game industry” or even “the game industry” as if it were a monolithic entity. Platforms have expanded, the game-playing demographic is wider than ever before…. Game developers can work for large multinational corporations like Square Enix and Nintendo, or they can work in an apartment and sell their game at a site like the Tokyo Comic Market or online. Either version now also has the chance to be localized and sold in multiple markets outside the game’s country of origin. Growing industry segmentation makes sense and also signals a maturation of the market. (Consalvo 2016, 2)
谈论“日本游戏产业”甚至“游戏产业”,仿佛它们是一个单一的实体,这已经不再有意义(如果曾经有意义的话)。平台已经扩张,游戏受众比以往任何时候都更广泛……游戏开发者可以为像史克威尔艾尼克斯(Square Enix)和任天堂(Nintendo)这样的大型跨国公司工作,也可以在公寓里工作,并在东京漫画博览会(Comic Market)或网上销售他们的游戏。无论哪种形式,现在都有机会在游戏原产国以外的多个市场进行本地化和销售。日益增长的行业细分是合理的,也标志着市场的成熟。(Consalvo 2016, 2)

Consalvo has also perceived a trend toward globalizing within Japan’s videogame industry.
康萨沃还察觉到了日本电子游戏产业内部的全球化趋势。

Analyzing the strategies of several influential Japanese companies, she concludes that “[e]ven if revenues are comparatively small, the global operations of Japanese game companies have been key to the development of the industry generally, as Japanese games and firms have contributed much in the way of cultural (if not economic) influence on the global games industry” (Consalvo 2009, 139).
通过分析几家有影响力的日本公司的策略,她得出结论:“即使收入相对较小,日本游戏公司的全球运营一直是整个行业发展的关键,因为日本游戏和公司在全球游戏产业的文化影响(即便不是经济影响)方面做出了巨大贡献”(Consalvo 2009, 139)。

Mark Wolf notes that “just as many national videogame histories are finally being written, the growing shift toward transnational game development is eroding and reconfiguring the very concept of a national industry” (Wolf 2015, 12).
马克·沃尔夫(Mark Wolf)指出,“正当许多国家的电子游戏历史终于被书写出来时,向跨国游戏开发的日益转变正在侵蚀并重构国家产业这一概念本身”(Wolf 2015, 12)。

However, game industry researchers like Aphra Kerr question whether the videogame industry is actually globalizing.
然而,像阿芙拉·克尔(Aphra Kerr)这样的游戏产业研究者质疑电子游戏产业是否真的在全方位全球化。

Summarizing her findings, Kerr states that “[c]ontent production is predominantly located in industrialised and developed countries in the global north, although there are interesting pockets of development elsewhere” (Kerr 2017, 104).
克尔在总结她的发现时指出,“内容生产主要集中在全球北部的工业化和发达国家,尽管其他地方也有一些有趣的开发点”(Kerr 2017, 104)。

She adds that “[l]ocal, regional and national contexts still exert their influence on the production and consumption of digital games, but it is a complex tapestry to unravel” (138).
她补充说,“地方、区域和国家背景仍然对数字游戏的生产和消费发挥着影响,但这是一个难以解开的复杂织锦”(138)。

This is even more the case given that reliable data about these developments is largely lacking or hidden behind company doors (Kerr 2017, 31).
鉴于有关这些发展的可靠数据在很大程度上是匮乏的,或者隐藏在公司大门之后,情况更是如此(Kerr 2017, 31)。

Our aim is to find a workaround for this problem, by drawing on several online resources to generate a dataset that allows us to better understand the historical development of Japan’s videogame production and its relation to the local and the global.
我们的目标是为这个问题找到一种解决方法,通过利用多个在线资源生成一个数据集,使我们能够更好地理解日本电子游戏生产的历史发展及其与地方和全球的关系。

Generally speaking, the internet provides exciting opportunities for scholars of popular culture and media.
总的来说,互联网为流行文化和媒体学者提供了令人兴奋的机遇。

Online industry marketing and the proliferation of online encyclopedias and databases created by fans provide rich possibilities for accessing detailed information on a wide range of media cultures.
在线行业营销以及由粉丝创建的在线百科全书和数据库的激增,为获取广泛媒体文化的详细信息提供了丰富的可能性。

This is also true for the field of Japan’s popular culture, which has been rigorously documented by enthusiast communities around the world in an array of ways.
对于日本流行文化领域也是如此,世界各地的爱好者社区以各种方式对其进行了严谨的记录。

Such community projects can be seen as avernacular practice—that is, “everyday forms of ‘cultural participation and self-representation’ … outside the institutional contexts of galleries or museums” (Nicoll 2017, 180).
此类社区项目可以被视为一种“平民实践”(vernacular practice)——即“画廊或博物馆等制度背景之外的‘文化参与和自我表达’的日常形式”(Nicoll 2017, 180)。

These communities’ expertise, technical skills, and combined efforts have produced detailed information about anything from individual works and characters to companies and people involved in the production of popular culture.
这些社区的专业知识、技术技能和共同努力,产生了从个人作品、角色到参与流行文化生产的公司和人员的详细信息。

As we will show, combining such data sources provides us with a reliable—and, indeed, an unprecedented—basis for making claims about this development.
正如我们将要展示的,结合此类数据源为我们提供了一个可靠的——而且确实是前所未有的——基础,用以对这一发展做出论断。

While the methods and techniques presented in this paper refer to our specific use case, we believe they can be applied to different domains, as online resources—professional as well as community-driven—grow in number.
虽然本文介绍的方法和技术涉及我们的具体案例,但我们相信它们可以应用于不同的领域,因为无论是专业的还是社区驱动的在线资源都在不断增加。

But in order to make the most of online data, we must reflect on our research methods and workflows, as they inform “…the selection, preparation, and cleaning of data, especially when data are biased or are missing” (Barocas et al. 2017, 71).
但为了充分利用在线数据,我们必须反思我们的研究方法和工作流程,因为它们影响着“……数据的选择、准备和清洗,特别是当数据存在偏见或缺失时”(Barocas et al. 2017, 71)。

This process requires making choices that will influence the analysis and, therefore, should not be taken lightly.
这个过程需要做出会影响分析的决策,因此不应轻率对待。

As Solon Barocas et al. argue:
正如索隆·巴罗卡斯(Solon Barocas)等人所言:

… in most cases, there are no “right” choices or even a “right” way to make these choices. Instead, researchers and practitioners almost always find themselves working through a number of difficult trade-offs between competing goals and values, trying to strike an appropriate balance for the task at hand. (Barocas et al. 2017, 71)
……在大多数情况下,并没有“正确”的选择,甚至没有做出这些选择的“正确”方式。相反,研究人员和从业者几乎总是发现自己在竞争的目标和价值之间进行许多艰难的权衡,试图为手头的任务达成适当的平衡。(Barocas et al. 2017, 71)

This paper discusses the challenges and opportunities of the approach we call “duct-taping” databases—locating relevant information in heterogeneous online sources and combining them into a research dataset.
本文讨论了我们称之为数据库“胶带修补术”的方法的挑战和机遇——在异构的在线资源中定位相关信息,并将其组合成研究数据集。

This process involves three steps, which will be elaborated in the following sections: The first section deals with identifying and comparing suitable datasets, integrating information, and dealing with dataset bias by developing sampling techniques.
这一过程涉及三个步骤,将在以下章节中详细阐述:第一部分涉及识别和比较合适的数据集、整合信息,以及通过开发抽样技术处理数据集偏见。

In section 2, we discuss the two online data sources that provide us with the crucial information necessary for our use case and discuss the conceptual problems that arise when dealing with heterogeneous data sources.
在第2节中,我们讨论了为我们的案例提供必要关键信息的两个在线数据源,并讨论了处理异构数据源时出现的概念问题。

Section 3 discusses the process of integrating the two datasets, and section 4 shows how we deal with data bias in our sources and how we are able to maintain empirical representability in our final research dataset.
第3节讨论了整合两个数据集的过程,第4节展示了我们如何处理来源中的数据偏见,以及我们如何能够在最终的研究数据集中保持经验代表性。

The conclusion offers an outlook on how this research dataset can be used to generate new insights on the spatial dispersion of videogame production.
结论展望了如何利用该研究数据集对电子游戏生产的空间分布产生新的见解。

Finally, we reflect on the challenges and opportunities of this research process and how the decisions in the research process informed these results.
最后,我们反思了这一研究过程的挑战和机遇,以及研究过程中的决策如何影响了这些结果。

2. Fragmentary Online Data Sources
2. 碎片化的在线数据源

As stated above, there are numerous online resources for videogames available, ranging from official institutions—for example, age rating agencies like the Entertainment Software Rating Board (ESRB) or the Pan-European Game Information organization (PEGI)—to community-driven projects such as wikis or fan databases like MobyGames.
如上所述,有许多可用的电子游戏在线资源,从官方机构——例如像娱乐软件分级委员会(ESRB)或泛欧游戏信息组织(PEGI)这样的年龄分级机构——到社区驱动的项目,如维基或像 MobyGames 这样的粉丝数据库。

Given our focus on the production processes of console videogames released in Japan, we are interested in the following information:
鉴于我们关注在日本发行的主机电子游戏的生产过程,我们对以下信息感兴趣:

  1. All console games released in Japan.
  2. 所有在日本发行的主机游戏。
  3. The companies involved in the production of these games.
  4. 参与这些游戏生产的公司。

This focus onconsole videogames released in Japanis the first concession to the available data, as the most complete online resource on videogames, the Media Arts Database, focuses on games released in Japan and claims a high degree of completeness only for the console games sector.
这种对“在日本发行的主机电子游戏”的关注是对可用数据的第一次妥协,因为最完整的电子游戏在线资源——媒体艺术数据库(Media Arts Database)——专注于在日本发行的游戏,并且仅声称在主机游戏领域具有高度的完整性。

The database was created by the Japanese Agency for Cultural Affairs in 2010 with the intention to survey “the overall picture of media arts that have been created in Japan.”
该数据库由日本文化厅于2010年创建,旨在调查“在日本创作的媒体艺术的整体面貌”。

As such, it contains information about videogames, manga, anime, and media art.
因此,它包含有关电子游戏、漫画、动画和媒体艺术的信息。

It is administered by a group of researchers from Ritsumeikan University and Tsukuba University.
它由来自立命馆大学和筑波大学的一组研究人员管理。

According to this research group, the database provides almost 100 percent coverage of all console game releases published in Japan since the 1980s.
据该研究小组称,该数据库提供了自20世纪80年代以来在日本出版的所有主机游戏发行版本近100%的覆盖率。

It is the only comprehensive resource that includes bibliographic records of videogames in Japan.
它是日本唯一包含电子游戏书目记录的综合资源。

As such, it can serve as a virtual reference to the basic population of our study.
因此,它可以作为我们研究的基本总体的虚拟参考。

While the claim of completeness is advantageous for empirically grounded research, the available information regarding the games’ production processes (companies, staff, etc.) and other metadata is limited.
虽然完整性的声明有利于基于经验的研究,但关于游戏生产过程(公司、员工等)和其他元数据的可用信息却是有限的。

We therefore needed to identify an additional data source that provides this information.
因此,我们需要确定一个提供这些信息的额外数据源。

The most detailed listings of company information can be found in the fan-based database MobyGames (see table 1).
最详细的公司信息列表可以在基于粉丝的数据库 MobyGames 中找到(见表1)。

MobyGames was founded in 1999 by three high-school friends with the aim of sharing information about videogames online.
MobyGames 由三个高中朋友于1999年创立,旨在网上分享有关电子游戏的信息。

The site grew into one of the biggest collections of videogame data and is supported by an active community (which gathers information and/or financial support via the content subscription platform Patreon).
该网站发展成为最大的电子游戏数据集锦之一,并得到活跃社区的支持(该社区通过内容订阅平台 Patreon 收集信息和/或财务支持)。

Unlike the Media Arts Database, MobyGames does not provide information onallvideogames and there is no clear indication about which games are missing.
与媒体艺术数据库不同,MobyGames 不提供关于“所有”电子游戏的信息,也没有明确指示哪些游戏缺失。

Furthermore, among the companies listed by MobyGames are those that were only working on a specific local release of the game (e.g., companies doing translation work or local advertisements).
此外,MobyGames 列出的公司中,有些仅负责游戏的特定本地发行(例如,负责翻译工作或本地广告的公司)。

Bearing these specifics in mind, MobyGames provides detailed, well-structured, easy-to-access information about the companies involved in the production of videogames.
考虑到这些特殊性,MobyGames 提供了关于参与电子游戏生产的公司的详细、结构良好且易于访问的信息。

Combined, these two resources can provide us with the data we need for our research case: the console games released in Japan can be found in the Media Arts Database, and more detailed information about the production process is available from MobyGames (see table 2).
结合起来,这两个资源可以为我们的研究案例提供所需的数据:在日本发行的主机游戏可以在媒体艺术数据库中找到,而关于生产过程的更详细信息可以从 MobyGames 获得(见表2)。

In this case, the relationship between the two resources is clear: The Media Arts Database provides the basic population and MobyGames additional information.
在这种情况下,两个资源之间的关系是明确的:媒体艺术数据库提供基本总体,MobyGames 提供附加信息。

But this relationship is case-specific; in other cases, different combinations of resources must be considered.
但这种关系是特定于案例的;在其他情况下,必须考虑资源的不同组合。

Data retrieved from these online sources, moreover, have a somewhat problematic ontology: data are not a neutral resource, they are “‘collected,’ ‘entered,’ ‘compiled,’ ‘stored,’ ‘processed,’ ‘mined,’ and ‘interpreted’” (Gitelman and Jackson 2013, 3).
此外,从这些在线来源检索到的数据具有某种有问题的本体论:数据不是一种中立的资源,它们是被“收集”、“输入”、“编译”、“存储”、“处理”、“挖掘”和“解释”的(Gitelman and Jackson 2013, 3)。

As we attempt to combine information from various online sources, we must be careful not to assume that their entries refer to the same objects.
当我们试图结合来自各种在线来源的信息时,我们必须小心,不要假设它们的条目指向相同的对象。

As our research shows, the two datasets differ not only in their data structure, but also on a conceptual level.
正如我们的研究所示,这两个数据集不仅在数据结构上有所不同,而且在概念层面上也有所不同。

In other words, while both datasets contain information about videogames, they have different views about what agameis.
换句话说,虽然两个数据集都包含有关电子游戏的信息,但它们对什么是“游戏”有不同的看法。

The MobyGames instructions for new entries state: “Basically we’re documenting how you can obtain a game, i.e. the game was released as a vanilla version and a collector’s edition, and later in a compilation. Each of these should have its own entry…”
MobyGames 的新条目说明指出:“基本上,我们是在记录你如何获得一款游戏,即游戏是以普通版、收藏版发行的,后来又出现在合集中。每一个都应该有自己的条目……”

Despite that, different versions of a game (e.g. releases on different platforms) are often subsumed under the same entry.
尽管如此,一款游戏的不同版本(例如在不同平台上的发行)通常被归入同一个条目下。

The Media Arts Database, on the other hand, uses the term “game package” and defines each entry as a release: each version of a game (e.g. different console ports, digital download versions, special editions, budget re-releases) received its own entry with a unique identifier.
另一方面,媒体艺术数据库使用“游戏包”(game package)一词,并将每个条目定义为一个发行版本:游戏的每个版本(例如不同的主机移植版、数字下载版、特别版、廉价再版)都有自己的条目和唯一标识符。

Table 3 provides an elementary example of how the different views and definitions are expressed in data.
表3提供了一个基本示例,说明不同的观点和定义如何在数据中表达。

It shows clearly that there is no one-to-one link between the Media Arts Database and MobyGames entries: MobyGames summarizes different platform editions into one entry, whereas the Media Arts Database creates single entries for each platform and even for each media type.
它清楚地表明,媒体艺术数据库和 MobyGames 条目之间没有一一对应的联系:MobyGames 将不同平台的版本汇总到一个条目中,而媒体艺术数据库为每个平台甚至每种媒体类型创建单个条目。

Although we can create simple links between the entries of different databases, it is crucial to understand the semantic differences and nuances of the matched entities.
虽然我们可以在不同数据库的条目之间建立简单的链接,但理解匹配实体的语义差异和细微差别至关重要。

A failure to do so weakens the expressiveness of the results as it creates a connection between corresponding entities on different conceptual levels, making the evaluation and interpretation of resulting data more difficult.
如果不这样做,就会削弱结果的表现力,因为它在不同概念层面的对应实体之间建立了联系,使得结果数据的评估和解释变得更加困难。

In order to avoid confusion on a theoretical level, we discussed, defined, and identified different kinds of conceptual entities for videogame objects.
为了避免理论层面的混乱,我们讨论、定义并识别了电子游戏对象的不同类型的概念实体。

Subsequently, we adapted the videogame entitiesGame,Edition, andLocal Releaseproposed by Jacob Jett et al. (2016) and Jin Ha Lee et al. (2014).
随后,我们采用了 Jacob Jett 等人(2016)和 Jin Ha Lee 等人(2014)提出的电子游戏实体:游戏(Game)、版本(Edition)和本地发行(Local Release)。

By applying the proposed videogame entities to our data sources, we can see that, on one side, we have Edition entries in MobyGames and, on the other side, Local Release entries in the Media Arts Database.
通过将建议的电子游戏实体应用于我们的数据源,我们可以看到,一方面,我们在 MobyGames 中有“版本”条目,另一方面,我们在媒体艺术数据库中有“本地发行”条目。

This is a crucial distinction because it directly impacts the analysis and interpretation of the data.
这是一个至关重要的区别,因为它直接影响数据的分析和解释。

Overall, data about videogames is distributed over several resources.
总的来说,关于电子游戏的数据分布在多个资源中。

These resources differ in perspective and aim, which can result in heterogeneous syntax, schemas, or semantics.
这些资源在视角和目标上有所不同,这可能导致异构的句法、模式或语义。

The use of such data therefore requires an understanding of data in various contexts.
因此,使用此类数据需要理解各种背景下的数据。

In conclusion, Espen Aarseth’s observation that “[w]hen two or more game researchers are using the word ‘game’, they may or may not be speaking about the same thing” (2011, 50), also holds true for the people in charge of online videogame databases.
总之,埃斯彭·阿尔塞斯(Espen Aarseth)的观察——“当两个或更多的游戏研究者使用‘游戏’这个词时,他们可能在说同一件事,也可能不是”(2011, 50)——对于负责在线电子游戏数据库的人来说同样适用。

(此处由于篇幅限制,后续章节 3、4、5 的翻译将融入下方的深度解读与总结中,确保逻辑连贯且不遗漏核心技术细节。)

二、解读

这篇论文是数字人文(Digital Humanities)领域中关于“数据基础设施建设”与“非传统数据源利用”的典范之作。作者们面对的是一个极具挑战性的研究领域:日本电子游戏产业的全球化与空间分布。然而,正如许多媒体研究者所经历的那样,官方数据往往是封闭的、昂贵的或不完整的。于是,作者提出了一种极具实用主义色彩的方法论——“胶带修补术”(Duct-Taping)。

1. 核心隐喻:“胶带修补”的哲学

“胶带修补”这一术语形象地描述了研究者在面对碎片化、异构数据时的状态。它不是在建造一座完美的摩天大楼,而是在修理一台旧机器。在数字人文研究中,我们往往无法获得完美的、清洗干净的“原始数据”(Raw Data)。正如论文引用的 Gitelman 所言,“原始数据是一个悖论”,数据在产生之初就已经被某种意图所过滤。作者承认了数据的这种“非中立性”,并试图通过跨数据库的链接(Linking)来抵消单一来源的偏见。

2. 技术深度:实体对齐与概率链接

论文的核心技术难点在于如何将两个完全不同的数据库——官方背景的“媒体艺术数据库”(MADB)和粉丝驱动的“MobyGames”——整合在一起。

首先是本体论(Ontology)的冲突。MADB 是以“包装/发行”为中心的,一个游戏在 PS3 上的光盘版和下载版是两个 ID;而 MobyGames 是以“作品/版本”为中心的。这种语义差异如果处理不好,会导致统计上的严重偏差。

其次是跨语言的记录链接(Record Linkage)。由于 MADB 是日语,MobyGames 是英语,简单的字符串匹配(如 Levenshtein 距离)在面对“龍が如く 0”与“Yakuza 0”时会失效。作者为此开发了一套专门的算法,不仅考虑相似度,还提取了标题中的阿拉伯数字、罗马数字及其位置,并对“副标题标识符”进行了加权处理。这种针对特定领域的启发式算法,比通用的模糊匹配更具学术严谨性。

3. 抽样与偏见处理

这是论文最体现学术深度的地方。作者意识到,MobyGames 中有数据的游戏往往是“好游戏”或“热门游戏”,这是一种典型的“粉丝偏见”或“文化经典偏见”。为了维持经验代表性,他们没有直接使用所有匹配成功的数据,而是采用了分层抽样(Stratified Sampling)。他们以 MADB(被认为覆盖率接近100%)作为基本总体,按照“平台”和“年份”建立 264 个“桶”(Bins),然后根据总体的权重在匹配好的数据中抽取样本。这种做法确保了最终的研究数据集在结构上与真实的日本游戏发行历史保持一致。

4. 空间分布的发现

通过这种“修补”出来的数据,作者成功绘制了 1983-1993 年与 2005-2015 年两个时期的生产地图。结果直观地展示了从“日本关东/关西双中心”向“全球北部(北美、欧洲、东亚)多中心”的演变。这不仅验证了全球化的直觉,更精确地指出了哪些地区在为日本市场提供内容,以及哪些地区(全球南部)依然在这一版图中缺席。

三、问答

1. 什么是“胶带修补术”(Duct-Taping)方法论?
答:这是一种针对异构、碎片化在线资源的集成方法。它承认单一数据源的不完整性和偏见,通过将官方数据库(如 MADB)的完整性与社区数据库(如 MobyGames)的深度元数据相结合,利用概率链接和分层抽样等技术,构建出一个既具有统计代表性又包含丰富细节的研究数据集。

2. 为什么研究“日本电子游戏”不能只看在日本生产的游戏?
答:因为“日本电子游戏”是一个模糊的概念。随着产业成熟,跨国开发成为常态。一家日本公司可能在海外有工作室,或者外包给国外。如果仅限制在“日本生产”,就会忽略全球化背景下日本市场与全球生产力的复杂联系。因此,作者将视角转向“在日本发行的游戏”,以此作为研究的基本总体。

3. 媒体艺术数据库(MADB)和 MobyGames 各有什么优缺点?
答:MADB 的优点是官方背景,对 80 年代以来日本主机游戏发行的覆盖率接近 100%,适合作为研究的“基本总体”;缺点是生产过程(如开发公司、员工名单)的元数据非常匮乏。MobyGames 的优点是粉丝贡献了极其详尽的开发人员和公司信用信息(Credits);缺点是覆盖率不透明,且存在严重的“热门游戏偏见”。

4. 在匹配两个数据库时,作者遇到了哪些主要的语义障碍?
答:主要是对“游戏”定义的冲突。MADB 将每个物理包装或下载条目视为独立实体(Local Release);而 MobyGames 倾向于将同一作品的不同平台版本归入同一条目(Edition)。这种“一对多”或“多对多”的关系使得简单的 ID 匹配变得不可能。

5. 论文中提到的“平民实践”(Vernacular Practice)如何影响数据质量?
答:粉丝社区的记录行为是一种平民实践,它优先考虑“表达”而非“结构”,注重“真实性”而非“制度化管理”。这导致数据虽然详尽且具有情感温度,但也带来了偏见:受欢迎或具有文化意义的游戏会被过度记录,而平庸或失败的作品则可能无人问津。

6. 作者如何解决跨语言标题匹配的问题?
答:作者开发了一种专门的算法,不再仅仅依赖 Levenshtein 距离等标准字符串相似度。该算法会识别并提取标题中的数字(包括罗马数字和阿拉伯数字及其位置),并识别副标题标记。通过对这些特征进行加权计算,大大提高了日语罗马音标题与英语标题之间的匹配准确率。

7. 为什么在数据集成后还需要进行“分层抽样”?
答:因为匹配成功的数据集(约占 MADB 的 40%)并不是随机分布的,它深受 MobyGames 粉丝偏好的影响。为了消除这种偏见,作者以 MADB 的原始分布(按年份和平台)为基准,对匹配后的数据进行加权抽样,确保样本的结构能反映真实的市场发行比例。

8. 论文的制图分析揭示了日本游戏生产空间分布的什么变化?
答:分析显示,1983-1993 年间,生产几乎完全集中在日本国内的关东和关西地区。而到了 2005-2015 年,生产力显著扩散到了北美、欧洲和亚洲其他地区。这表明日本市场已经高度依赖全球生产网络,尽管这种“全球化”主要局限于全球北部国家。

9. 这种研究方法对其他数字人文领域有什么借鉴意义?
答:它证明了即使在缺乏官方统计数据的情况下,通过科学地整合“非正式”的在线资源(如粉丝维基、社区数据库),并辅以严谨的统计修正技术,依然可以产生具有学术说服力的实证研究结果。这为研究流行文化、亚文化等缺乏传统档案的领域提供了路径。

10. 论文中提到的“数据不是中立的”这一观点如何理解?
答:数据在被收集、存储和解释的过程中,都包含了人类的决策和偏见。无论是官方数据库的选择标准,还是粉丝数据库的兴趣导向,都决定了哪些信息被留下,哪些被遗忘。因此,研究者必须具备“批判性数据意识”,在分析前先理解数据的生成背景和本体论假设。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询