Major League Baseball's Statcast có thể phá vỡ Sabermetrics

"Trên cơ sở lịch sử, một thập kỷ kể từ bây giờ, chúng tôi sẽ nhìn lại để nói rằng, 'Đó là hiệu suất tuyến đường cao nhất từng được ghi lại trong bóng chày.'"

Đó là những gì Joe Inzerillo - phó chủ tịch điều hành kiêm giám đốc công nghệ của MLB Advanced Media - cho biết trong một thông cáo báo chí của giải đấu công bố hệ thống theo dõi cầu thủ mới mang tính cách mạng của bóng chày, Statcast. Đã không được một thập kỷ kể từ câu trích dẫn đó; Trên thực tế, nó đã không hoàn toàn được ba năm. Nhưng hiệu quả tuyến đường, chỉ số được đề cập, đã biến mất.

Sử dụng kết hợp máy ảnh và radar để theo dõi trái bóng ở mọi vị trí mà nó chạm tới cũng như mọi cầu thủ trên sân mọi lúc, cung cấp một cái nhìn hoàn hảo về mặt lý thuyết hoặc ít nhất là hoàn hảo về mọi trận đấu diễn ra trong mọi mùa giải lớn, Statcast cung cấp Khả năng phân tích bóng chày gần như vô hạn bằng cách tạo ra một lượng dữ liệu thô đáng kinh ngạc, một số trong số đó được đóng gói thành các số liệu cụ thể do một nhóm người tại MLBAM thiết kế. Có những số liệu thống kê giúp người khác hiểu được thông tin, số liệu thống kê hoạt động như một công cụ kể chuyện, số liệu thống kê nhằm tạo ra các lớp ý nghĩa và ngữ cảnh bổ sung cho cơ sở kiến ​​thức mới rộng lớn này và số liệu thống kê nhằm đáp ứng các kết hợp khác nhau của các chức năng này. Khi Statcast được triển khai trên toàn giải đấu và ra mắt công chúng vào năm 2015, hiệu quả của lộ trình là một trong những điểm nổi bật nhất trong số các chỉ số này, nhằm mục đích nắm bắt, ít nhiều, đúng như tên của nó đã mô tả — lộ trình hiệu quả mà một tiền vệ đi đến một quả bóng, với 0% là kém hiệu quả nhất và 100% là nhiều nhất.

Trong suốt năm 2015 và 2016, hiệu quả của lộ trình ở khắp mọi nơi: trên các chương trình phát sóng quốc gia, trên các tài khoản mạng xã hội của giải đấu, trong các bài báo trên trang web của MLB. Và sau đó, trước khi mùa giải vừa qua bắt đầu, nó lặng lẽ biến mất. MLB đã ngừng đề cập đến nó một cách công khai và sau đó xóa nó khỏi bảng chú giải thuật ngữ trực tuyến của Statcast. Thay vào đó, họ bắt đầu vô địch bằng một chỉ số phòng thủ ngoài sân mới và được cải thiện: xác suất bắt bóng, sử dụng khoảng cách cần thiết để đến được một quả bóng và thời gian người cầm bóng phải đến đó để tìm ra khả năng bị bắt bóng.

Đối với nhiều người hâm mộ - hầu hết những người có xu hướng quan tâm, có thể - việc chuyển đổi từ hiệu quả của tuyến đường sang xác suất bắt được chỉ là một đốm sáng trên radar, nếu nó thậm chí còn được ghi nhận. Đối với MLBAM, đó là một ví dụ về quy trình lặp đi lặp lại cần thiết để tìm ra cách tốt nhất để hiểu dữ liệu mới này và chia sẻ nó theo cách hấp dẫn và có ý nghĩa trong khi vẫn có thể truy cập được cho tất cả các loại người hâm mộ khác nhau. Và đối với một nhóm nhỏ nhưng nhiệt thành gồm các nhà phân tích bóng chày nghiệp dư độc lập, đó là một hành vi vi phạm nghiêm trọng: cố gắng loại bỏ công việc công cộng mà không thảo luận cởi mở về các sai sót của nó và quan trọng hơn là không công bố dữ liệu thô cơ bản được sử dụng để xây dựng các chỉ số trong lần đầu tiên địa điểm. Đó là một bước tiến rõ ràng trong mắt MLBAM — họ đã khám phá ra một cách để cải thiện công việc của mình và vì vậy tất nhiên họ đã thực hiện nó. Nhưng đối với một số bác sĩ kiểm tra hạng nặng và các thành viên của các cộng đồng lân cận của họ, sự tiến bộ không thể và không thể có ý nghĩa trừ khi được xây dựng trên các nguyên tắc truyền thống đã hướng dẫn nghiên cứu bóng chày công cộng: tính minh bạch, phương pháp luận cởi mở, năng lực và khuyến khích đánh giá đồng cấp.

Hiệu quả tuyến là một phần nhỏ của những gì Statcast đã sản xuất cho đến nay và một phần nhỏ hơn nhiều về những gì nó có thể sản xuất trong tương lai. Nhưng nó chỉ ra một trong những câu hỏi hóc búa nhất mà Statcast phải đối mặt: Làm thế nào để một hệ thống do liên đoàn sở hữu và điều hành có thể giải trí và phục vụ nhu cầu xây dựng thương hiệu đồng thời tạo ra các nghiên cứu tiên tiến? Hơn nữa, câu trả lời cho câu hỏi đó có ý nghĩa gì đối với tình trạng của các bài phân tích bóng chày công cộng? Statcast — một hệ thống độc quyền, khép kín có thể đóng vai trò là kết thúc cuối cùng của hoạt động tìm kiếm kiến ​​thức dựa trên cộng đồng và truy cập mở truyền thống — có khả năng trả lời những câu hỏi có ý nghĩa nhất của sabermetrics. Nếu có, nó sẽ không làm như vậy bằng cách đi theo con đường truyền thống của phong trào sabermetric.

Để hiểu tại sao các nhà phân tích lại quan tâm sâu sắc đến Statcast, điều quan trọng đầu tiên là phải hiểu nó hoạt động như thế nào và nó có thể làm gì. Hệ thống này có hai phần: camera, được sử dụng để theo dõi chủ yếu các cầu thủ và radar, được sử dụng để theo dõi quả bóng. Các camera có độ phân giải cao quay video lập thể và đến từ công ty trực quan hóa dữ liệu và đồ họa phát sóng ChyronHego; radar theo dõi quả bóng bằng cách theo dõi các đường nối với tốc độ 20.000 khung hình / giây và đến từ công ty TrackMan của Đan Mạch. Sự kết hợp này mang lại vô số thông tin đáng kinh ngạc về một lần chơi, không nói gì đến toàn bộ trò chơi, tất cả đều được mô tả bằng một từ vựng kỹ thuật độc đáo. Bạn có thông tin chính xác về nơi người ném bóng đã thả bóng (phần mở rộng), mức độ anh ta ném (vận tốc), loại độ xoáy anh ta có (tốc độ xoáy) và tốc độ nó xuất hiện đối với người đánh bóng (vận tốc cảm nhận). Bạn biết độ mạnh của quả bóng được đánh (vận tốc thoát ra), cách nó bay ra khỏi gậy (góc phóng) và chính xác vị trí của nó (hướng bóng đánh). Bạn có vị trí của người chơi khi ném sân và cách chúng di chuyển khi ném trúng đích; bạn biết một tiền vệ ném biên khó như thế nào (sức mạnh của cánh tay) và tốc độ của người chạy (tốc độ chạy nước rút).

Trong số tất cả những thứ này, về cơ bản, bạn có một cách để định lượng mọi khía cạnh của trò chơi, bất kể là bao nhiêu phút. Sự tồn tại của hệ thống Statcast vốn đã tạo ra một cuộc cách mạng về số liệu thống kê và phân tích bóng chày và đến lượt mình, chính bóng chày. Các thước đo nâng cao của môn thể thao này theo truyền thống là tìm cách chuyển đổi hiệu suất của người chơi thành các thước đo định lượng cụ thể về giá trị: số lần chạy, số trận thắng. Statcast cung cấp một khuôn khổ mới, cho phép bạn, nhà phân tích và câu lạc bộ khiêu vũ có cơ hội hỏi và trả lời các câu hỏi khác nhau về cơ bản. Các chỉ số hiện tại thường kiểm tra kết quả cuối cùng là gì, kết quả cuối cùng nên là gì, ai chịu trách nhiệm chính và tất cả những điều này có giá trị gì, được biểu thị bằng giá trị xấp xỉ của các giá trị có giá trị gần đúng so với chiến thắng. Những câu hỏi này và những ý tưởng đằng sau chúng, đều hợp lệ và quan trọng theo cách riêng của chúng, nhưng Statcast không chỉ có thể xây dựng trên cấu trúc này mà còn chuyển hoàn toàn nó sang một chiều không gian khác. Statcast có khả năng trả lời cách một vở kịch đã xảy ra và tại sao một vở kịch lại xảy ra và ý nghĩa của nó, cụ thể, không phải là một sự trừu tượng mà là một thứ theo đúng nghĩa của nó.

Mỗi đội bóng của các giải đấu lớn đều thực hiện phân tích riêng về dữ liệu này trong nội bộ và ngôn ngữ cụ thể của Statcast đang ngày càng thay thế từ vựng bóng chày truyền thống và chung chung hơn trong mọi thứ, từ thông báo trước văn phòng đến phản ứng của người chơi. "Nâng cao quả bóng" đã được tung ra chừng nào mà bóng chày còn tồn tại, nhưng khi Ryan Zimmerman đạt được chiến thắng trong trận đấu trên sân nhà trước Chicago Cubs trong Trận 2 của Giải Hạng nhất Quốc gia năm nay, đồng đội Bryce Harper đã đề cập đến "Góc phóng tuyệt vời" trong phần bình luận sau trò chơi của anh ấy.

Matt Meyers, giám đốc nội dung cấp cao cho biết: “Thật là không thể hiểu được, 5 năm trước, nếu nói rằng về cơ bản một trong năm người chơi hàng đầu trong trò chơi sẽ sử dụng một thuật ngữ như thế để mô tả một trò chơi cao cấp. cho trang web của MLB và một trong những máy chủ của podcast Statcast chính thức.

Những gì các đội đang tự làm với dữ liệu để chọn cầu thủ, đánh giá và huấn luyện họ — giống như bất kỳ công việc phân tích nội bộ nào — được giữ kín, là một phần của cuộc chiến giành lợi thế cạnh tranh. Nhưng cách Statcast được sử dụng ở nơi công cộng thuộc về Meyers và đồng nghiệp của anh ta. (Đội ngũ đó sẽ sớm bao gồm Ben Jedlovec, cựu chủ tịch của công ty thống kê hàng đầu Baseball Info Solutions, người gần đây đã thông báo rằng anh ấy sẽ tham gia vào tháng 1.) Họ không chỉ bị tính phí khi tìm ra cách sử dụng dữ liệu để nghiên cứu hấp dẫn những câu hỏi lớn nhất của bóng chày, nhưng cũng để tìm ra cách nghiên cứu đó có thể được chuyển tiếp — hoặc dịch — đến người hâm mộ theo những cách thú vị và giải trí nhưng không hy sinh ý nghĩa. Khung mà họ đã xây dựng ảnh hưởng rất nhiều đến cách Statcast được sử dụng trên các chương trình phát sóng, trên các tài khoản mạng xã hội của giải đấu và đội và trên màn hình video của các sân bóng trong các trận đấu. Đó là một công việc vốn đã khó khăn, và đặc biệt là khi người ta xem xét phạm vi rộng lớn của người hâm mộ mà họ đang nói chuyện: những người giữ chặt các nhân vật cũ của trường học như chạy đua, những người đọc các trang web sabermetric hàng ngày và tất cả mọi người ở giữa. Đối với một số người hâm mộ, công việc của họ có thể trở thành một bài giảng toán học không mong muốn ở giữa trò chơi; đối với những người khác, nó có vẻ như là một nỗ lực không bao giờ đủ khắt khe về mặt trí tuệ hoặc kỹ thuật.

“Tôi cố gắng nghĩ về nó theo cách, Làm thế nào tôi có thể viết cái này theo cách mà bố tôi có thể thích nó? Mike Petriello, một nhà phân tích MLBAM được thuê đặc biệt để làm việc với Statcast cho biết. “Anh ấy là một chàng trai thông minh, một người hâm mộ bóng chày, nhưng anh ấy không quá mê những con số điên rồ. Đó luôn là phần thú vị đối với tôi — làm cách nào để cân bằng cả hai cơ sở người hâm mộ đó? ”

Một số tính năng đã nhận được phản hồi tốt nhất từ ​​người hâm mộ là các số liệu thô khai thác vào khung cơ bản của môn bóng chày mà hầu hết người hâm mộ đều nên có. vận tốc thoát, ví dụ, được chuyển tải trong một cách mà tất cả mọi người được-dặm một giờ và trên thang điểm đó là khá dễ hiểu. Một chàng trai đánh quả bóng với tốc độ 100 dặm / giờ là quả bóng đập mạnh, và mọi người có thể tận mắt chứng kiến. Điều tương tự cũng xảy ra với một số thứ như sức mạnh cánh tay. Theo nghĩa này, Statcast cung cấp một cái gì đó gắn chặt hơn với hoạt động bóng chày thực tế hơn là hầu hết các con số khác của môn thể thao này. Những số liệu này không yêu cầu phải vướng vào các cấu trúc khái niệm mà cung cấp nền tảng cho nhiều số liệu khác, những số liệu được thấy khi ước tính số lần chạy lý thuyết được phép trên hoặc dưới mức trung bình, trong UZR (xếp hạng vùng cuối cùng) hoặc chắt lọc nhiều các khía cạnh khác nhau của cuộc chơi thành một con số duy nhất để đo lường tổng hiệu suất so với người chơi thay thế, trong WAR (thắng trên thay thế). Statcast đang định lượng các tính năng đơn giản và hữu hình hơn nhiều và khá đơn giản, tập trung hơn vào bóng chày khi nó được chơi trên sân. Những con số này không phản ánh cách một người chơi đăng ký với tất cả những người chơi khác từng được đo trong môi trường lý thuyết; họ cho bạn biết một cầu thủ ném mạnh như thế nào, anh ta chạy nhanh như thế nào, bóng bay ra khỏi gậy của anh ta như thế nào.

Petriello nói: “Đó thực sự chỉ là quay trở lại những điều bạn thấy trên sân. “Bạn không thể thấy một cuộc chạy có trọng số được tạo ra cộng. Bạn không thể nói, tôi đã thấy điều đó . Nhưng bạn có thể nói, tôi đã thấy Jake Marisnick hoặc bất kỳ ai ném bóng khó nhất từ ​​ngoài sân trong suốt mùa giải , hoặc, tôi đã thấy đường chạy trong nhà nhanh nhất từng được theo dõi . Vì vậy, tôi nghĩ theo nghĩa đó, bạn không cần phải phức tạp hóa nó. Bạn có thể nói nhanh nhất, tốt nhất . Bạn chỉ đang đặt những con số cho nó. "

Tuy nhiên, phần lớn những gì Statcast cung cấp phức tạp hơn nhiều so với những con số tương đối đơn giản này. Giải quyết một vấn đề nhiều khía cạnh, chẳng hạn như cách đánh giá khả năng phòng thủ ngoài trường liên quan đến việc đóng gói dữ liệu thành các chỉ số mới kết hợp các phần có ý nghĩa của thông tin liên quan thành một con số. Đây là nơi xuất hiện một khái niệm như hiệu quả tuyến đường hoặc xác suất bắt và là nơi Statcast phải trả lời một số câu hỏi lớn nhất của nó.

Đầu tiên, có một câu hỏi là làm thế nào họ quyết định những ý tưởng nào sẽ giải quyết và họ làm như vậy theo thứ tự nào.

“Tất cả chúng ta đều có những điều chúng ta thực sự muốn làm. Petriello nói khi đề cập đến những cấp cao hơn tại MLBAM, chẳng hạn như phó chủ tịch bộ phận phân tích Cory Schwartz. “Và sau đó - không đơn giản như thế nào, nhưng chúng ta có thể làm được những điều đó như thế nào? Đây là một nỗ lực hai tuần, hay đây là một nỗ lực tám tháng? … Thật tuyệt khi đôi khi có thể lảo đảo. ”

(Một số dự án hiện đang được thực hiện bao gồm mô hình ruồi hy sinh để xác định xem một đội có nên cử người chạy hay không và một số liệu để phân tích trách nhiệm của người bắt đối với các căn cứ bị đánh cắp.)

Sau đó là vấn đề làm thế nào để người hâm mộ có thể dễ dàng trình bày và hiểu những khái niệm này. Một điều cần xem xét là cách các chỉ số sẽ được sử dụng trực tuyến, điều này mang lại lợi ích là không gian không giới hạn để giải thích và sự tiện lợi khi có thể liên kết đến bảng thuật ngữ Statcast do MLBAM duy trì. Nhưng họ cũng phải cân nhắc xem chỉ số sẽ xuất hiện như thế nào trong bối cảnh hạn chế hơn nhiều. Chẳng hạn như, một phân đoạn phát lại dài 45 giây trên chương trình phát sóng quốc gia.

“Đó là loại hạt khó bẻ gãy nhất — tìm cách đưa nó lên các chương trình phát sóng,” Meyers nói. “Bởi vì nó phải nhanh chóng và nó phải dễ dàng ngữ cảnh hóa và nó phải là thứ mà các nhà bình luận sẽ quan tâm và mua vào. Vì vậy, bạn cần tất cả những thứ này, và một phần lớn thách thức là tạo ra những chỉ số và công cụ mà chúng tôi biết có thể được sử dụng trong thời gian thực. ”

Cuối cùng, câu hỏi đặt ra là làm thế nào để xây dựng một số liệu chính xác - một quá trình đã thay đổi đáng kể với việc thuê Tom Tango vào năm ngoái làm kiến ​​trúc sư cơ sở dữ liệu cao cấp của dự án.

Tango là một trong những bài nổi bật nhất trong làn sóng đầu tiên của các nhà phân tích bóng chày trực tuyến và sự nổi lên của cá nhân anh ấy phản ánh một cách lỏng lẻo điều đó của phong trào lớn hơn. Anh ấy đã bắt đầu giống như cách mà hầu hết mọi người đã làm trong thời đại nền tảng của sabermetrics trực tuyến, khoảng hai thập kỷ trước — kết nối với những người hâm mộ có khuynh hướng thống kê khác trên bảng tin, phân tích bộ sưu tập công khai của Retrosheet về điểm số hộp và hình thành cộng đồng thông qua chia sẻ và thảo luận về nghiên cứu . Một trong những bước đột phá quan trọng nhất của anh ấy đến từ việc xây dựng một khám phá của nhà phân tích nghiệp dư Voros McCracken, người mà Tango đã gặp trên trang web bóng chày hiện nay đã không còn tồn tại . Ông đã đưa đứa con tinh thần của McCracken về thống kê ném bóng không phụ thuộc vào phòng thủ tiến thêm một bước bằng cách phát triển ném bóng không phụ thuộc vào vị trí chắn bóng, FIP, một số liệu phổ biến hiện nay nhằm cải thiện ERA bằng cách tách hiệu suất cá nhân của người ném bóng khỏi công việc phòng thủ của anh ta.

Cộng đồng phân tích công khai ban đầu đó đã phát triển, với mọi người chia sẻ công việc của họ để những người khác có thể tranh luận về nó hoặc chứng thực nó hoặc tách nó ra khi họ thấy phù hợp. Và khi cơ quan nghiên cứu internet đó trở nên mạnh mẽ hơn và mang tính đột phá hơn, các ý tưởng của nó đã được các nhóm chú ý. Những bộ óc sáng suốt nhất của bảng tin ngày càng có cơ hội bước vào các trụ sở chính, và vì vậy những người ngoài cuộc trở thành người trong cuộc.

Tango nhận ra rằng các đội đang chú ý đến nghiên cứu của anh ấy khi tác giả của Moneyball, Michael Lewis gọi anh ấy lên để nói rằng văn phòng chính của đội A đang đọc tác phẩm của anh ấy và anh ấy đã tư vấn xong cho một số đội MLB. Tuy nhiên, công việc hiện tại của anh ấyvị trí toàn thời gian đầu tiên của anh ấy trong bóng chày . Bằng cách đưa anh ấy tham gia, MLBAM đã đầu tư vào một người đã từng là nhân vật hàng đầu không chỉ trong nghiên cứu bóng chày, mà đặc biệt là trong nghiên cứu bóng chày mở : một người đã giữ một blog phân tích công khai chạy trong nhiều năm tư vấn riêng, người đã giải thích số liệu thống kê tương đối phức tạp đối với độc giả bình thường với tư cách là tác giả của bộ sách kiếm hiệp nổi tiếng The Book , và là người đã ủng hộ mạnh mẽ và nhất quán cho môi trường mã nguồn mở đã tạo ra những năm đầu của sabermetrics trực tuyến.

Công việc của Tango bây giờ là sử dụng dữ liệu riêng tư và độc quyền của MLBAM để tạo thống kê công khai và cả anh ấy và các đồng nghiệp của mình đều nói rằng anh ấy đã thay đổi mô hình tạo chỉ số khá nhiều.

“Tôi nghĩ rằng thực sự, trong những năm đầu của Statcast, đó là, Hãy tính toán tất cả những điều này và hãy xuất bản chúng và sau đó cố gắng tìm hiểu ý nghĩa của nó sau đó ,” Tango nói về quá trình trong hai mùa giải trước khi anh ấy được đưa trên tàu. “Và tôi nghĩ rằng đó là nơi với hiệu quả của lộ trình, bạn gặp khó khăn - nơi mà dường như tự nhiên để làm theo cách họ đã làm, nhưng sau đó khi bạn thấy kết quả trên quy mô lớn, bạn nói, Chà, được rồi, có thể không . Vì vậy, bạn phải lùi lại một bước và nói, Bây giờ chúng ta thực sự phải tìm ra cách làm điều đó . "

Một vấn đề với hiệu quả của tuyến đường là hầu hết mọi tuyến đường đều nằm trong phạm vi hẹp từ 90 đến 100%, gây khó khăn cho việc xác định ngữ cảnh và thể hiện sự khác biệt có ý nghĩa. Một vấn đề khác được đưa vào định nghĩa của chỉ số: Một lộ trình hoàn toàn hiệu quả không phải lúc nào cũng là tốt nhất. Ví dụ, nếu một tiền vệ vòng ra sau quả bóng bay hy sinh để ném tốt hơn, anh ta sẽ bị phạt vì thiếu hiệu quả, mặc dù sự thiếu hiệu quả dường như là cần thiết để thực hiện lối chơi ngay từ đầu. Phiên bản cập nhật, xác suất nắm bắt, giải quyết vấn đề này bằng cách đặt một câu hỏi khác, một câu hỏi không có lý tưởng chủ quan như hiệu quả được gắn trong nền tảng của nó. Không phải hỏi đường đi bóng của một cầu thủ tiết kiệm đến mức nào, trong một môi trường mà tính kinh tế của các tuyến có thể có những hình thức khác nhau đáng kể; nó hỏi khả năng bắt được bóng, sử dụng dữ liệu cụ thể tồn tại cho các cơ hội bắt tương tự làm điểm so sánh.

MLBAM nói rằng họ muốn xem lại hiệu quả của lộ trình, ở một số hình thức, trong tương lai. Nghiên cứu này xét cho cùng là một quá trình lặp đi lặp lại dần dần và chúng đang tiến từng bước một. Nhưng đối với một số người trong cộng đồng nhỏ nhưng đầy nhiệt huyết của các nhà nghiên cứu công cộng độc lập, việc giải đấu vội vàng quảng bá chỉ số này trước khi họ nhận ra những sai sót của nó cho thấy một lý do nghiêm trọng để lo ngại.

Harry Pavlidis, giám đốc công nghệ của trang web sabermetric Baseball Prospectus và là người sáng lập công ty theo dõi sân PitchInfo cho biết: “Tôi nghĩ họ nghĩ rằng điều này sẽ dễ dàng hơn thực tế, nhưng không phải vậy. “Tôi không nghĩ rằng họ có cấu trúc quyết định phù hợp để quyết định đâu là sản phẩm tối thiểu có thể bán được trên thị trường.”

(Tiết lộ: Tôi đã viết cho Bản cáo bạch bóng chày trong mùa giải 2016 và hiện đang đóng góp cho loạt bài ngắn hàng tuần của họ.)

Theo truyền thống, hầu hết các phát triển chính trong phân tích bóng chày công cộng đều đến từ các nhà nghiên cứu cá nhân không liên kết với giải đấu. Nhiều thập kỷ trước, điều này là do những nhà nghiên cứu độc lập cá nhân thường là những người thu thập dữ liệu cần thiết ngay từ đầu. Tất nhiên, MLB từ lâu đã vượt qua những người có sở thích này về mặt thu thập dữ liệu trò chơi. Nhưng họ thường công khai dữ liệu đó. Ngay cả trong bước tiến lớn về công nghệ cuối cùng của bóng chày — hệ thống theo dõi sân Pitchf / x, được lắp đặt tại các sân bóng giải đấu lớn vào năm 2008 — tất cả thông tin kết quả đều được công bố cho các nhà phân tích bên ngoài làm việc cùng. Nhưng điều đó không xảy ra với Statcast, điều này đã khiến nhiều nhà nghiên cứu bên ngoài hơi thất vọng và nghi ngờ. Một số phần dữ liệu nhất định đã được công bố trực tiếp, chẳng hạn như vận tốc thoát và góc phóng của quả bóng được đánh bóng và nhiều phần khác có thể được thu thập từ các chỉ số như xác suất bắt bóng. Nhưng dữ liệu thô hoàn chỉnh vẫn là một hộp đen, điều này khiến việc xem xét các chỉ số của MLBAM trở nên khó khăn và có thể gây nhầm lẫn khi những con số đó được cập nhật hoặc thậm chí bị loại bỏ hoàn toàn. Khiếu nại phổ biến nhất về số phận của hiệu quả tuyến đường không phải là liên minh sẵn sàng thử nghiệm và thử nghiệm với các chỉ số tiềm năng khác nhau. Đó là việc thử nghiệm tiếp tục diễn ra sau những cánh cửa đóng kín, trong khi các kết quả ban đầu đã được công bố như những công cụ chất lượng cao cho công chúng.

Rob Arthur, một nhà nghiên cứu độc lập đã từng là cố vấn văn phòng MLB trước đây và hiện đang xuất bản phân tích của mình tại FiveThirtyEight, cho biết: “Nên có một tiêu chuẩn cao hơn. “Tôi nghĩ đó là một trong những cách mà đôi khi họ đã sai lầm. Tôi không thấy có vấn đề gì khi chơi trong hộp cát, nhưng nếu bạn định chơi trong hộp cát, bạn phải tìm mọi cách để vào đó. Bạn phải cung cấp những gì đang diễn ra và giải thích hiệu quả của tuyến đường có nghĩa là gì và nó đến từ đâu và cho chúng tôi thấy những nội dung thô đi vào nó ”.

Các nhà phân tích như Pavlidis và Arthur thất vọng khi dữ liệu bị đóng không chỉ vì nó gây khó khăn cho việc đánh giá tính chặt chẽ về mặt khái niệm và kỹ thuật của các số liệu mà còn vì nó gây khó khăn cho việc đánh giá độ chính xác của dữ liệu. Máy ảnh và radar của Statcast rất tiên tiến, nhưng chúng không hoàn hảo. Ví dụ, vào tháng 8 năm ngoái, Arthur đã công bố nghiên cứu so sánh thông tin trò chơi công khai của Statcast với số liệu thống kê được ghi lại bởi những người xâu chuỗi con người để cho thấy rằng radar hoàn toàn bỏ sót 10 đến 15% các quả bóng được đánh bóng (chủ yếu là những quả bóng có quỹ đạo bất thường, chẳng hạn như cửa sổ bật lên rất cao hoặc rất tiếp đất thấp). Statcast thừa nhận điều này và hệ thống ước tính thông tin về các quả bóng bị mất bằng cách kết hợp các quan sát từ những người xâu chuỗi của con người tại công viên với những con số mà họ có quỹ đạo đánh trung bình. Tuy nhiên, thực tế là Statcast có nhiều khả năng bỏ lỡ một số loại bóng đánh bóng nhất định có nghĩa là một số loại bóng đánh bóng nhất định có nhiều khả năng có cấu hình không hoàn chỉnh, điều này có thể tạo ra tập dữ liệu sai lệch. Điều này khiến nhà phân tích độc lập Jeff Zimmerman cố gắng tìm và kết hợp dữ liệu bị thiếu từ năm 2015 và 2016 vào bảng thành tích tốc độ thoát và góc phóng của riêng mình , được công bố trên trang web sabermetric FanGraphs vào tháng 12 năm ngoái.

Đó chỉ là những quả bóng được đánh bóng. Năm nay đã gây ra một cuộc tranh cãi hoàn toàn riêng biệt về thông tin theo dõi quảng cáo chiêu hàng. Cho đến năm 2017, dữ liệu cụ thể về sân của MLBAM đến từ Pitchf / x, hệ thống camera được lắp đặt ở tất cả các công viên giải đấu lớn cho mục đích đó gần một thập kỷ trước. Nhưng bắt đầu từ mùa giải này, họ quyết định chuyển từ camera của Pitchf / x sang radar của Statcast. (Radar đã được sử dụng để theo dõi trái bóng trong trận đấu, nhưng bất kỳ thông tin cụ thể nào về sân bóng — chẳng hạn như vận tốc — đều đến từ hệ thống camera của Pitchf / x.) Pitchf / x và Statcast không tương quan chính xác, mặc dù. Vận tốc đầu tiên đo vận tốc từ điểm đặt cách sân nhà 50 đến 55 feet, trong khi vận tốc thứ hai đo ngay ngoài tay người ném. Điều này có nghĩa là các bài đọc Statcast gần như sẽ luôn nhanh hơn và việc chuyển từ các bài đọc Pitchf / x đã dẫn đến một số thay đổi đáng kể trong dữ liệu quảng cáo chiêu hàng cơ bản. Cho những người không biết rằng sự thay đổi này đã xảy ra (đó là chỉ là về tất cả những ai đã không liên kết trực tiếp với MLB), nó trông giống như hầu hết các bình trong các giải đấu đã trải qua một vết sưng vận tốc của càng nhiều càng tốt một vài dặm trên giờ. Vào ngày 3 tháng 4, nhà văn kiêm nhà phân tích Jeff Sullivan của FanGraphs đã xuất bản một bài báo được chú ý nhiều ; ngày hôm sau, tổng biên tập của FanGraphs Dave Cameron đã giải thích từ MLBAM rằng hệ thống theo dõi sân trên thực tế đã thay đổi .

Đối với nhiều nhà nghiên cứu độc lập, việc thiếu giao tiếp ban đầu trên switch là điều đáng thất vọng, nhưng thực tế là switch đã tạo ra các vấn đề mới với dữ liệu thậm chí còn nhiều hơn thế. Hệ thống radar dường như không được hiệu chỉnh phù hợp với các sân ở mọi sân bóng, gây ra các vấn đề đo lường chưa bao giờ thực sự là vấn đề với Pitchf / x. Một vài tuần sau mùa giải, Arthur đã công bố một công trình cho thấy rằng các lỗi trong chuyển động của sân theo chiều ngang và chiều dọc trong hệ thống mới cao hơn so với bất kỳ thời điểm nào trong lịch sử gần đây của Pitchf / x. Các lỗi này đã giảm dần trong suốt mùa giải, Tango cho biết, và hiện có tuyên bố từ chối trách nhiệm ở đầu trang tìm kiếm dữ liệu BaseballSavant.com Statcast của MLBAM lưu ý rằng vận tốc sân từ năm 2008-16 là do máy quay Pitchf / x và những người từ năm 2017 trở đi là từ radar Statcast. Việc làm rõ đó là thông tin và cần thiết, nhưng tình hình vẫn có thể gây khó chịu cho bất kỳ ai cố gắng phân tích trong nhiều năm, chẳng nói gì đến việc một người hâm mộ bình thường nhanh chóng kiểm tra xem liệu cầu thủ ném bóng yêu thích của anh ấy có ném khó hơn mùa trước hay không. Trong một giải đấu mà mức tăng velo thậm chí một dặm mỗi giờ có thể có ý nghĩa, việc so sánh các phép đo được thực hiện bởi các hệ thống khác nhau có thể cảm thấy vô ích về cơ bản. Thiết lập này làm cho nghiên cứu hiện tại khó xây dựng hơn và nó cung cấp cho nghiên cứu trong tương lai kích thước mẫu nhỏ hơn để từ đó rút ra.

Hệ thống của Statcast ngày càng tốt hơn theo thời gian, một phát hiện mà Arthur đã ghi nhận trong nghiên cứu về bóng đập của mình và được liên đoàn nhấn mạnh. Tango nói rằng MLBAM có các cuộc trò chuyện hàng tuần với ChyronHego và TrackMan về công nghệ này, cũng như các cuộc trò chuyện bình thường thường xuyên hơn về bất cứ điều gì có vẻ như có khả năng bị tắt. Một số điều dễ nhận thấy và bắt đầu giải quyết — chẳng hạn như một vấn đề đầu mùa này đo vận tốc ở sân bóng mới của Atlanta — và một số vấn đề khác là những vấn đề lâu dài phức tạp hơn, chẳng hạn như tìm ra cách để camera ngăn chặn việc mất người chơi trong bóng tối của sân ngoài.

Không ai mong đợi hệ thống tung ra với dữ liệu hoàn toàn đầy đủ và chính xác ngay từ đầu. Đó đơn giản không phải là bản chất của phân tích theo dõi hệ thống đa cảm biến. Nhưng thực tế là hầu hết dữ liệu đã được giữ kín đã khiến các nhà phân tích độc lập khó có thể nói chính xác hệ thống đang thiếu thông tin ở đâu và như thế nào. Nó hoàn toàn trái ngược với sự ra đời của một hệ thống như Pitchf / x, nơi các nhà phân tích công khai có thể tìm hiểu dữ liệu và đưa ra đề xuất về các lĩnh vực có thể cần cải thiện — tất nhiên, cùng với các ý tưởng về những cách tốt nhất để sử dụng dữ liệu và những thông tin chi tiết phong phú nhất có thể thu thập được từ đó.

Pavlidis nói: “Họ sẽ tốt hơn bây giờ [nếu dữ liệu Statcast được mở]. “Ba năm tham gia Pitchf / x, chúng tôi đã làm rất nhiều để sửa dữ liệu và điều đó luôn được khuyến khích”.

Công ty đứng sau hệ thống Pitchf / x (SportVision, đã được tập đoàn công nghệ thể thao SMT mua lại) tích cực hợp tác với các nhà nghiên cứu độc lập đang làm việc với dữ liệu, mời Pavlidis và những người khác đến hội nghị để trình bày những phát hiện của họ. Chưa có bất kỳ động thái tương tự với Statcast-Mặc dù vậy, với quyết định MLBAM để giữ cho dữ liệu hoàn chỉnh thiết lập riêng, thật khó để tưởng tượng rằng các nhà nghiên cứu sẽ có gần như nhiều việc phải trình bày như họ đã làm trong một tình huống mà họ đã có quyền truy cập mà , như Pitchf / x.

“[MLBAM] có thể đạt được các chỉ số tốt hơn nhanh hơn nếu tất cả dữ liệu đều được công khai. Tiến sĩ Alan Nathan, giáo sư vật lý danh dự tại Đại học Illinois và là một nhà phân tích bóng chày đã xuất bản, cho biết sẽ có một đội quân nghiệp dư ở ngoài kia — những người nghiệp dư rất tài năng, có thể nói rằng họ sẽ phát triển các thước đo của riêng họ. nghiên cứu với dữ liệu Statcast và thực hiện các nghiên cứu sâu rộng về khoa học của môn thể thao này. “Đó là cách Pitchf / x được phát triển. Dữ liệu hoàn toàn được công khai và MLBAM, tôi nghĩ, được hưởng lợi rất nhiều từ những người đang trăng hoa và thực hiện phân tích này trong thời gian rảnh rỗi. Họ được hưởng lợi rất nhiều từ trí tuệ tập thể được phát triển đó. "

Có những điểm tương đồng rõ ràng có thể được rút ra giữa Pitchf / x và Statcast, nhưng thật không công bằng khi so sánh một đối một. Trước đây là một tập dữ liệu khá lớn và chi tiết; thứ hai là vô cùng, đáng kể hơn như vậy. Nhìn chung, bao gồm cả video thô, Statcast tạo ra vài terabyte dữ liệu không nén cho mỗi trò chơi riêng lẻ. (Đó là nhiều dữ liệu thô hơn Thư viện Quốc hội Mỹ thêm vào kho lưu trữ web của mình mỗi tháng chỉ trong một trò chơi.) Dữ liệu thống kê cuối cùng được lưu trữ dễ quản lý hơn nhiều, ở mức 250 megabyte mỗi trò chơi không có video. Nhưng khi bạn đang nói về một mùa đầy đủ, điều đó vẫn tạo ra một tập hợp mà các nhà nghiên cứu nghiệp dư sẽ khó làm việc hơn nhiều so với trường hợp của Pitchf / x.

Trong bối cảnh tổng lượng dữ liệu Statcast hiện có, những gì được phát hành công khai chỉ là một phần rất nhỏ. Nhưng so với những gì mà người hâm mộ bóng chày phải làm việc chỉ vài năm trước đây, đó là một sự nâng cấp đáng kể.

“Tôi chắc chắn hiểu tại sao mọi người đều muốn mọi thứ,” Petriello nói về mong muốn của các nhà phân tích độc lập đối với dữ liệu mở. “Nhưng tôi hy vọng rằng mọi người sẽ thấy thú vị rằng — chỉ ba năm trước, khi nghĩ rằng bạn sẽ có vận tốc thoát và góc phóng cho mỗi quả bóng được đánh, biết được tốc độ của mỗi người chơi! —Có rất nhiều thứ đó ngoài đó."

rất nhiều. Chỉ cần một vài cú nhấp chuột vào Baseball Savant, trang web lưu trữ dữ liệu, có thể cung cấp cho bạn mọi thứ từ bảng thành tích tốc độ nước rút đến chất lượng tiếp xúc của bất kỳ quả bóng nào. Nhưng nó sẽ không cung cấp cho bạn tất cả mọi thứ và khi nói đến tương lai của một cộng đồng phân tích công khai được xây dựng dựa trên việc xem xét và phê bình các phân tích của những người khác, điều đó thật đáng lo ngại.

Arthur nói: “Về lâu dài, tôi nghĩ nó có nguy cơ làm nghẹt thở cộng đồng phân tích công khai, vì chúng tôi sẽ không thể có chất lượng dữ liệu giống như những người trong liên minh và các nhà phân tích làm việc cho các đội. “Chúng tôi sẽ không thể xem xét kỹ lưỡng các quyết định của họ hoặc thậm chí hiểu những gì họ đang làm. Tôi lo lắng rằng về lâu dài, chúng tôi sẽ không đạt được nhiều tiến bộ vì dữ liệu này không có hoặc đang bị kiểm soát chặt chẽ đến mức chúng tôi không thể xem xét nó. "

MLBAM phản bác ý kiến ​​này bằng cách nói rằng vẫn còn rất nhiều cơ hội để công chúng thực hiện các nghiên cứu có ý nghĩa chỉ với dữ liệu hiện có sẵn. Ví dụ, thông tin về góc phóng và vận tốc thoát có thể được sử dụng để phân tích cú đánh theo bất kỳ cách nào mà mọi người thậm chí còn chưa bắt đầu mơ đến.

“Có thể do quá nhiều dữ liệu nên họ không biết bắt đầu từ đâu,” Tango nói về tình trạng nghiên cứu hiện tại với thông tin công khai trên Statcast. “Đã có quá nhiều thứ rồi, còn rất ít việc phải làm, và chúng tôi tiếp tục cung cấp ngày càng nhiều hơn. Tôi không biết rằng điều quan trọng là chúng tôi phải xả toàn bộ ngay bây giờ và quá tải hơn nữa ”.

Đối với các nhà phân tích độc lập, đây là một câu hỏi mang tính nguyên tắc nhiều hơn là một vấn đề thực tế đơn giản: Nó không phải là quá nhiều về những gì đã được thực hiện, mà là về những gì có thể được thực hiện trong một môi trường mà hàng trăm bộ óc khác nhau đang xem xét dữ liệu và mang lại quan điểm mới cho bảng. Không phải là các nhà nghiên cứu công khai tin rằng làm việc với dữ liệu có thể cho phép họ tìm ra câu trả lời mới cho các câu hỏi về Statcast của MLBAM, mặc dù điều đó chắc chắn đúng. Đó là họ rất có thể suy nghĩ để tiếp cận dữ liệu với những câu hỏi mới hoàn toàn.

Tuy nhiên, với một bộ dữ liệu lớn và phức tạp như Statcast, các nguyên tắc của một mã nguồn mở lý tưởng có một số ràng buộc thực tế. Quy mô tuyệt đối của điều này có nghĩa là phân tích có ý nghĩa sẽ phức tạp hơn nhiều và đòi hỏi nhiều nhà nghiên cứu nghiệp dư hơn so với các nguồn dữ liệu bóng chày khác. (Điều này không có nghĩa là sức mạnh tính toán có thể cần thiết để truy cập và thao tác toàn bộ tập dữ liệu: tùy thuộc vào hình thức mà thông tin đó lấy, chỉ cần tải xuống máy tính cá nhân có thể mất hàng giờ.) Điều đó không có nghĩa là không có bất kỳ nhà phân tích độc lập nào có kinh nghiệm, bộ kỹ năng và thiết bị để giải quyết Statcast — tất nhiên là có — nhưng điều đó có nghĩa là có ít nhà phân tích trong số họ hơn so với trường hợp nói đến, ví dụ, công việc sáng tạo được thực hiện với Pitchf / x.

Mặc dù Pitchf / x đã được công bố rộng rãi hơn theo nghĩa là toàn bộ tập dữ liệu của nó đã được phát hành, nó chưa bao giờ là một thực thể công cộng có thương hiệu theo cách của Statcast. Statcast có sự hiện diện trên phương tiện truyền thông xã hội của riêng mình, một podcast được chỉ định, vị trí nổi bật trên các chương trình phát sóng và nhà tài trợ của chính công ty - Amazon Web Services, cung cấp bộ nhớ dữ liệu của hệ thống. Statcast tham vọng hơn bất cứ điều gì MLB từng làm trước đây về lượng thông tin thu thập được, nhưng nó cũng đầy tham vọng về đối tượng mà nó đang cố gắng tiếp cận: bất kỳ ai và tất cả những ai thích bóng chày.

Phần lớn, đại đa số những người thích bóng chày không phải là những người thực hiện phân tích độc lập với mối quan tâm mạnh mẽ về độ chính xác của dữ liệu. Mối quan tâm của các nhà nghiên cứu này có giá trị sâu sắc - muốn có thể tin tưởng rằng dữ liệu là đầy đủ và chính xác, và các số liệu được xây dựng tốt, là muốn hệ thống hoạt động ở mức cao nhất có thể cho tất cả những người tương tác với nó. Nhưng MLBAM không hoạt động với mục tiêu duy nhất là trở thành nhà cung cấp dữ liệu và Statcast không hoạt động với mục tiêu duy nhất là trở thành một công cụ nghiên cứu và phân tích chuyên sâu.

“Tôi nhận ra rằng mình không phải là khán giả,” Pavlidis nói khi được hỏi về cách nhìn nhận của anh ấy về Statcast đã thay đổi như thế nào trong ba năm mà nó đã hoạt động hoàn chỉnh. “Tôi nói với những người tôi làm việc cùng: điều này không dành cho bạn.”

Theo một nghĩa nào đó, có điều gì đó không vui khi nghe một nhân vật đáng chú ý trong phân tích công khai của bóng chày nói rằng anh ta nhận ra công cụ phân tích đáng chú ý nhất của trò chơi không dành cho anh ta. Nhưng theo một nghĩa khác, một ý nghĩa thực dụng hơn nhiều: Nó không phải, và tất nhiên là không. Một công cụ đang hoạt động để thu hút người hâm mộ bóng chày bình thường trong một phân đoạn phát sóng ngắn sẽ tự nhiên hoạt động khác nhiều so với một bài thuyết trình tại hội nghị phân tích hàng năm của Hiệp hội Nghiên cứu Bóng chày Hoa Kỳ. Điều đó không phải để bác bỏ những lời chỉ trích chính đáng về bản thân việc thu thập dữ liệu hoặc nói rằng sẽ không có lợi ích có ý nghĩa nào khi công khai dữ liệu. Nhưng cách mà Statcast được sử dụng, chẳng hạn, một điểm nổi bật nhanh chóng trên Jumbotron tự nhiên sẽ không hấp dẫn một cách đáng kinh ngạc đối với một nhà nghiên cứu có kinh nghiệm, người có đầu óc tự động chuyển sang câu hỏi về biên độ sai sót.

Lấy thang điểm mà MLBAM đã phát triển cho xác suất bắt được: xếp hạng số lần bắt được là một, hai, ba, bốn hoặc năm sao tùy thuộc vào khả năng thực hiện chúng như thế nào.

“Tất cả chúng ta đều giống nhau, Chúng ta muốn một biến liên tục hiển thị xác suất ,” Pavlidis nói về cách các nhà phân tích đồng nghiệp của anh ấy phản ứng khi thấy một hành động quá phức tạp và bị ảnh hưởng bởi rất nhiều yếu tố khi tỷ lệ bắt được giảm xuống một nhãn đơn giản như bốn sao . “Nhưng điều đó không quan trọng - nếu họ muốn giới thiệu nó là bốn sao, điều đó thật tuyệt. Miễn là những gì dưới mui xe tốt, điều đó thật tuyệt vời ”.

Đối với MLBAM, sự đơn giản tương đối của một nhãn như bốn sao thực sự là lý tưởng, hơn là một tác dụng phụ có thể chấp nhận được. Những người làm việc trên Statcast coi quy mô này là một thành công đáng chú ý, một quy mô đưa ra một khái niệm có thể cảm thấy trừu tượng và dễ hiểu. Nói rằng một trò chơi nhất định có xác suất bắt 44 phần trăm không có nghĩa là gì theo đúng nghĩa của nó; bất cứ ai có thể nói rằng một đánh bắt bốn sao là khá tốt. Ở đó có một mức độ khả năng tiếp cận chưa từng có so với các chỉ số phòng thủ phức tạp hơn khác.

“Chúng tôi nghĩ về UZR, đó là lối chơi +0,82 và chúng tôi hiểu những người theo dõi hoặc tìm hiểu sâu về nó biết điều đó có nghĩa là gì,” Tango nói, trích dẫn một trong những chỉ số phòng thủ nổi bật nhất được phát triển trước Statcast. “Nhưng thật khó để truyền đạt loại số đó - nó bị mất trong tất cả các số thập phân. Sau đó, chúng ta có thể nói, Byron Buxton có 29 vở kịch bốn và năm sao , Ender Inciarte có 23 vở kịch bốn và năm sao . Bây giờ đây trở thành một con số thực sự có thể liên quan đến một con số vật lý, hữu hình. Và chúng tôi cũng sẽ nhớ điều đó, cách chúng tôi ghi nhớ số lần chạy trên sân nhà và số trận thắng. "

Giống như bất kỳ thứ gì mà Statcast phát triển, nhãn bốn saonăm sao không có nghĩa là để kết thúc cuộc trò chuyện. Chúng chỉ đơn giản là để bắt đầu nó, hoặc thêm một lớp khác, hoặc cung cấp một số bối cảnh thống kê: hoạt động như một thành phần có ý nghĩa của một cuộc thảo luận bóng chày, chứ không phải là chính cuộc thảo luận. “Chúng tôi đang cố gắng tìm cách để đảm bảo rằng chúng tôi làm nổi bật nó khi nó thực sự kể một câu chuyện — để sử dụng nó như một công cụ chứ không phải một công cụ cùn”, Meyers nói. Mục tiêu là làm cho Statcast và các chỉ số của nó trở thành một phần tự nhiên, có ý nghĩa trong bối cảnh của fandom bóng chày cho bất kỳ ai muốn nó.

Bản thân nó vẫn là một công việc đang được tiến hành. Khi nó được tung ra vào đầu mùa giải, nó vẫn chưa tính đến hướng dẫn bóng (theo cách nói của người hâm mộ bóng chày thông thường: liệu tiền vệ có phải quay trở lại quả bóng, hướng về phía xa khung thành hay không) . Chỉ số đã được cập nhật vào tháng 5 để bao gồm tính năng đó. Và nó vẫn chưa giải thích đầy đủ về việc liệu cầu thủ này có phải chơi bóng cận thành hay không, đó là điều mà MLBAM hy vọng có thể áp dụng vào mùa đông này.

“Nếu tôi muốn làm cho nó hoàn hảo, tôi cần có 15 thành phần khác nhau,” Tango nói về xác suất bắt. “Có lẽ tôi sẽ mất chín tháng chỉ để làm điều này, để làm cho nó đúng. Hoặc chúng tôi có thể thực hiện một bước nhảy vọt về phía trước, thể hiện điều đó, và sau đó chúng tôi cải tiến khi thời gian cho phép và khi chúng tôi ưu tiên mọi thứ khác mà chúng tôi muốn làm ”.

Điều đó đáng chú ý là khác với quy trình vận hành khá chuẩn trong cộng đồng phân tích công khai: thông thường, nếu một nhà nghiên cứu biết điều gì đó mà anh ta đang làm chưa hoàn thiện, anh ta sẽ muốn, tốt, hoàn thành nó trước khi phát hành (hoặc ít nhất là tát một “bản beta ”Trên đó). Nhưng như Tango lưu ý, các khuyến khích và mục tiêu toàn cảnh của một doanh nghiệp phức tạp như Statcast khác hẳn với những gì một gã trăng hoa trên Bản cáo bạch bóng chày. Và trong khi các nhà nghiên cứu độc lập thường đo lường hệ thống theo các tiêu chuẩn giống như bất kỳ dự án nào khác trong phân tích bóng chày công cộng - hoặc thậm chí bằng các dự án cao hơn, với sự tham gia và đầu tư của liên đoàn - nó đơn giản không phải là bất kỳ dự án nào khác trong phân tích bóng chày công cộng. Nó cần nói chuyện với một lượng khán giả lớn hơn và đa dạng hơn, và nó cần có sẵn dưới nhiều hình thức hơn, và nó cần hoạt động trên một thời gian biểu kết hợp nhiều đối tác. Statcast không chỉ nhắm đến phân tích bóng chày công cộng mà còn là giải trí bóng chày công cộng.

Công nghệ phân tích bóng chày đi đầu theo truyền thống là thứ mà người hâm mộ chọn để truy cập. Vào những năm 60, họ chọn đọc Earnshaw Cook; trong những năm 80, họ chọn mua các bản tóm tắt của Bill James; vào những năm 90, họ chọn đi chơi trong nhóm rec.sport.baseball trên Usenet; ngày nay, họ chọn truy cập số liệu thống kê trên FanGraphs hoặc Bản cáo bạch bóng chày. Những cá nhân và cộng đồng bên lề trò chơi này đã phát triển và tiến bộ vượt bậc trong nhiều thập kỷ và những hiểu biết sâu sắc của họ có ý nghĩa sâu sắc đối với cách các văn phòng cấp cao nghĩ về trò chơi và những gì các nhóm nghiên cứu riêng. Nhưng các trụ cột chính của thống kê bóng chày công khai — những con số được chuyển tiếp trong điểm số hộp, trên chương trình phát sóng, ở mặt sau của thẻ bóng chày — phần lớn vẫn giữ nguyên. Trừ khi một người hâm mộ chọn đi tìm kiếm thứ gì đó khác, họ có điểm trung bình đánh bóng và chiến thắng của người ném bóng và rất ít vượt qua điều đó.

Statcast thay đổi mô hình đó. Statcast không phải là thứ mà người hâm mộ phải tìm kiếm - nó chỉ ở đó . Nó có trong bất kỳ chương trình phát sóng quốc gia nào, nó có trên tài khoản mạng xã hội của các đội, nó ở đó trong các cuộc phỏng vấn hàng ngày với các cầu thủ. Phạm vi là đáng chú ý, và cũng hơi phức tạp. Nó mang lại cho Statcast một nền tảng lớn hơn vô cùng so với bất kỳ nỗ lực phân tích nào khác trong lịch sử trò chơi và điều đó yêu cầu thông tin phải có thể truy cập theo những cách mà các lần lặp lại phân tích bóng chày trước đây không bao giờ phải lo lắng.

“Nói thì có vẻ khập khiễng, nhưng nó dành cho tất cả mọi người,” Meyers nói. “Có rất nhiều người có thể được phục vụ bởi nó — các đội đang tìm kiếm lợi thế cạnh tranh, điều đó rõ ràng là ở cực điểm của nó, nhưng nó cũng dành cho những người hâm mộ bình thường. Đó là những gì chúng tôi thực sự đang cố gắng tạo ra những công cụ này có thể thu hút những người hâm mộ bình thường và tìm cách giúp họ thưởng thức trò chơi nhiều hơn, ngay cả khi họ không nhất thiết nghĩ rằng họ muốn nó. "

Statcast cho tất cả mọi người, và điều đó có nghĩa là tất cả mọi người có thể và có thể có một vấn đề với nó. Nhưng điều đó cũng có nghĩa rằng đó là điều chưa từng có trong không chỉ phân tích bóng chày, mà còn cả bản thân bóng chày.

Pavlidis nói: “Tôi gặp phải tất cả những vấn đề này với những thứ nhất định, và tôi sẽ làm điều này và điều khác. “Nhưng cũng có thể, Chúa ơi! Nhìn này. Thật đáng kinh ngạc! Có tất cả những dữ liệu đáng kinh ngạc này mà họ cung cấp cho chúng tôi chẳng có gì - không có gì! Nó miễn phí… Đây là một món quà. ”

Suggested posts

Người hâm mộ Astros không thể tin rằng doanh số bán súng giảm sau hiệp thứ bảy

Người hâm mộ Astros không thể tin rằng doanh số bán súng giảm sau hiệp thứ bảy

HOUSTON — Bày tỏ sự không hài lòng với chính sách chính thức của Minute Maid Park, Rylan Murphy, người hâm mộ Houston Astros, nói với các phóng viên hôm thứ Hai rằng anh không thể tin được rằng họ đã cắt bán súng sau hiệp thứ bảy. "Thật là nhảm nhí tùy tiện đến mức họ sẽ không bán cho bạn một khẩu súng trong hai hiệp cuối cùng mặc dù đó có thể là một giờ nữa của trận đấu," người giữ vé mùa giải cho biết thêm rằng ngay cả khi anh ta cố gắng tải lên súng ngắn trong phần thứ sáu, anh ấy chắc chắn muốn một cái khác ở trên cùng của thứ chín.

[CẬP NHẬT] Cảnh sát nói 3 phát súng bên ngoài Công viên Nats ở DC - người hâm mộ yêu cầu ở trong nhà cho đến khi hoàn toàn rõ ràng; trò chơi bị đình chỉ

[CẬP NHẬT] Cảnh sát nói 3 phát súng bên ngoài Công viên Nats ở DC - người hâm mộ yêu cầu ở trong nhà cho đến khi hoàn toàn rõ ràng; trò chơi bị đình chỉ

Nats nói với người hâm mộ không được rời đi sau khi các phát súng bắn ra. Một tình huống kinh hoàng đã diễn ra ở Washington vào đêm thứ Bảy khi những tiếng súng nổ bên ngoài sân bóng trong hiệp thứ sáu của trò chơi Nationals-Padres.

Related posts

Không, không phải Ryan Ellis

Không, không phải Ryan Ellis

Ryan Ellis ở bên phải không phải là người sẽ sớm kết thân với Gritty (đó sẽ là người có bộ râu rậm rạp). Ryan Ellis đã được giao dịch với Flyers vào thứ Bảy.

Ryan Ellis của Preds hướng đến Philly khi các đội có những động thái cuối cùng trước khi dự thảo mở rộng NHL

Ryan Ellis của Preds hướng đến Philly khi các đội có những động thái cuối cùng trước khi dự thảo mở rộng NHL

Ellis có thể là hậu vệ cánh phải tốt nhất của Flyers kể từ Eric Desjardins. Flyers GM Chuck Fletcher đã có người của mình.

Xem trước tiền của ngày Chủ nhật trong ngân hàng PPV

Xem trước tiền của ngày Chủ nhật trong ngân hàng PPV

Briefcase SZN đã trở lại! Và những người hâm mộ cũng vậy. Năm nay, Money In The Bank, kể từ khi bắt đầu đại dịch COVID tràn qua nước Mỹ, là khoản trả cho mỗi lượt xem lớn của WWE với người hâm mộ bên ngoài WrestleMania 37 kể từ tháng 4 vừa qua, tại Tampa, Fla.

Phim truyền hình quốc tế khi vận động viên cử tạ Olympic Uganda phá vỡ bong bóng an ninh

Phim truyền hình quốc tế khi vận động viên cử tạ Olympic Uganda phá vỡ bong bóng an ninh

Anh ấy đã nghỉ việc vì nó. Julius Ssekitoleko có thể đã không nghĩ đến điều này một cách thấu đáo.

MORE COOL STUFF

Steven Spielberg đã từng trả cho George Lucas lời khen ngợi hay nhất từ ​​trước đến nay

Steven Spielberg đã từng trả cho George Lucas lời khen ngợi hay nhất từ ​​trước đến nay

Steven Spielberg và George Lucas là bạn thân trong nhiều thập kỷ. Nhưng Spielberg đã từng dành cho Lucas lời khen cuối cùng.

Đạo diễn Kate Herron của 'Loki' đã sử dụng 'Kinh thánh cảm xúc' để giúp chỉ đạo các nhân vật trong sê-ri Disney +

Đạo diễn Kate Herron của 'Loki' đã sử dụng 'Kinh thánh cảm xúc' để giúp chỉ đạo các nhân vật trong sê-ri Disney +

Đạo diễn Kate Herron của 'Loki' đã dựa vào nhiều nguồn lực khác nhau để hoàn thành loạt phim, mang trong mình một 'kinh thánh tình cảm.'

Đạo diễn Kate Herron của 'Loki' tiết lộ điều gì cô ấy vui mừng nhất khi xem phần 2

Đạo diễn Kate Herron của 'Loki' tiết lộ điều gì cô ấy vui mừng nhất khi xem phần 2

Kate Herron đã làm một công việc tuyệt vời với phần 1 của loạt phim ăn khách 'Loki' của Marvel, nhưng rất vui mừng khi xem phần 2 có gì trong cửa hàng.

Damon Dash phát biểu về 'Nghi ngờ hợp lý' Trận chiến pháp lý giữa NFT với Jay-Z - 'Tại sao anh ta không muốn tôi bán thứ ba của mình?'

Damon Dash phát biểu về 'Nghi ngờ hợp lý' Trận chiến pháp lý giữa NFT với Jay-Z - 'Tại sao anh ta không muốn tôi bán thứ ba của mình?'

Damon Dash và Jay-Z đang ở giữa cuộc chiến pháp lý căng thẳng để giành quyền bán một NFT 'Nghi ngờ hợp lý'.

Ai sở hữu bãi biển? Nó phụ thuộc

Ai sở hữu bãi biển? Nó phụ thuộc

Trên hầu hết các bờ biển của Hoa Kỳ, công chúng đã có thời gian được quyền tiếp cận "bên" các bãi biển. Tuy nhiên, không gian đầy cát đó đang bị tranh cãi gay gắt.

Tokyo 2020 sẽ là một thế vận hội không giống ai

Tokyo 2020 sẽ là một thế vận hội không giống ai

Giữa một năm trì hoãn và một đại dịch toàn cầu vẫn đang tiếp diễn, Tokyo 2020 (hoặc 2021 nếu bạn muốn) không phải là Thế vận hội mà bất kỳ ai mong đợi. Nhưng nó chắc chắn là một trong những chúng tôi sẽ không bao giờ quên.

Cháy, phá rừng đã 'biến' Amazon thành nơi phát thải carbon

Cháy, phá rừng đã 'biến' Amazon thành nơi phát thải carbon

Một nghiên cứu kéo dài 10 năm chưa từng có được công bố trên tạp chí Nature cho thấy nạn phá rừng và cháy rừng đã làm giảm đáng kể khả năng hấp thụ khí thải carbon của rừng nhiệt đới Amazon.

Du lịch không gian có xứng đáng không?

Du lịch không gian có xứng đáng không?

Hôm nay, Blue Origin đã đưa người sáng lập tỷ phú Jeff Bezos và ba người khác bay vào vũ trụ, một tuần sau khi Virgin Galactic bay người sáng lập tỷ phú Richard Branson trong cùng một sứ mệnh. Du lịch vũ trụ sẽ không chỉ là sở thích của một triệu phú?

Người đàn ông bị bắt và bị buộc tội hiếp dâm sau khi mang thai bé gái 12 tuổi được đưa đến bệnh viện

Người đàn ông bị bắt và bị buộc tội hiếp dâm sau khi mang thai bé gái 12 tuổi được đưa đến bệnh viện

Juan Miranda-Jara, 24 tuổi, bị bắt và bị buộc tội hiếp dâm sau khi đưa một bé gái 12 tuổi đến bệnh viện Oklahoma để sinh em bé

Lindsey Vonn và Diego Osorio Bước ra cùng nhau ở NYC, cùng với Anna Kendrick, Larsa Pippen và hơn thế nữa

Lindsey Vonn và Diego Osorio Bước ra cùng nhau ở NYC, cùng với Anna Kendrick, Larsa Pippen và hơn thế nữa

Lindsey Vonn và Diego Osorio đến phòng tập thể dục cùng nhau, Anna Kendrick được nhìn thấy trên phim trường bộ phim mới của cô, Larsa Pippen đến bãi biển Miami. Xem những gì các ngôi sao đang lên.

Người bắn súng Kim Rhode trên Heading Into Her Seventh Olympics: 'Pinch Me'

Người bắn súng Kim Rhode trên Heading Into Her Seventh Olympics: 'Pinch Me'

Hầu như không có ai trên thế giới từng bảy lần là vận động viên Olympic. Không phải Kim Rhode

Tuần 1 Thế vận hội Tokyo: Khi nào và như thế nào để xem Simone Biles, Megan Rapinoe và những người khác cạnh tranh để giành vàng

Tuần 1 Thế vận hội Tokyo: Khi nào và như thế nào để xem Simone Biles, Megan Rapinoe và những người khác cạnh tranh để giành vàng

Lễ khai mạc Thế vận hội mùa hè Tokyo là thứ Sáu, nhưng cuộc thi đã được tiến hành khi Đội Mỹ bắt đầu hành trình tìm kiếm vàng.

Mặt tối của việc trở thành ông chủ của riêng bạn

nó thật sự đáng giá thế sao?

Mặt tối của việc trở thành ông chủ của riêng bạn

Mọi người và con chó của họ đang theo đuổi tự do ngay bây giờ. Chỉ cần nhìn vào tất cả các bài báo hối hả bên lề đang bị giáng xuống cổ họng của chúng tôi vào lúc này.

Hướng dẫn dễ làm theo về khả năng tiếp cận dành cho nhà thiết kế sản phẩm

Hướng dẫn dễ làm theo về khả năng tiếp cận dành cho nhà thiết kế sản phẩm

Giới thiệu về thiết kế bao gồm cho người mới bắt đầu. Tái bút: Bạn có thể tải xuống hướng dẫn của tôi dưới dạng pdf tại đây.

Cập nhật mới nhất của Apple Podcasts đã làm tôi mất 3.000 lượt nghe hàng tuần như thế nào

Cái nhìn của một podcaster về hệ thống đăng ký mới có nhiều sai sót và là đối thủ của Patreon

Cập nhật mới nhất của Apple Podcasts đã làm tôi mất 3.000 lượt nghe hàng tuần như thế nào

Phần lớn đã được tạo nên bởi sự khủng khiếp của bản cập nhật Apple Podcasts mới nhất dành cho người nghe. Các bài báo nằm rải rác trên web, khiến giao diện phản trực quan của nó bị phát tán, và nhiều người đã mất chương trình yêu thích của họ.

Máy chạy bộ không được tạo ra để tập thể dục: Chúng là thiết bị tra tấn

Lịch sử hành trình từ thiết bị tra tấn đến thiết bị tập luyện

Máy chạy bộ không được tạo ra để tập thể dục: Chúng là thiết bị tra tấn

Chúng ta biết rằng con người trong lịch sử cổ đại có sở trường về sự tàn ác, bất công, không trung thực,… thực ra, đó là nạn mù chữ. Người tốt và người xấu luôn tồn tại trong các xã hội, trong mọi thời đại.

Language