{"id":6015,"date":"2025-09-26T07:34:40","date_gmt":"2025-09-26T06:34:40","guid":{"rendered":"https:\/\/toshareproject.it\/artmakerblog\/?p=6015"},"modified":"2025-09-26T07:38:08","modified_gmt":"2025-09-26T06:38:08","slug":"how-sloppy-is-your-slop","status":"publish","type":"post","link":"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/","title":{"rendered":"How sloppy is your slop?"},"content":{"rendered":"<p><a href=\"https:\/\/arxiv.org\/pdf\/2509.19163\">https:\/\/arxiv.org\/pdf\/2509.19163<\/a><\/p>\n<p>REFERENCES<\/p>\n<p>Meta AI. Introducing llama 4: Advancing multimodal intelligence, 2024. URL https:\/\/ai.<br \/>\nmeta.com\/blog\/llama-4-multimodal-intelligence\/.<\/p>\n<p>Anthropic. Claude 3 model card addendum. Technical report, 2024. URL https:\/\/www-cdn.<br \/>\nanthropic.com\/fed9cc193a14b84131812372d8d5857f8f304c52\/Model_<br \/>\nCard_Claude_3_Addendum.pdf. Accessed: 2024-12-30.<\/p>\n<p>Kyrtin Atreides and David J Kelley. Cognitive biases in natural language: Automatically detecting,<br \/>\ndifferentiating, and measuring bias in text. Cognitive Systems Research, 88:101304, 2024.<br \/>\nPayal Bajaj, Daniel Campos, Nick Craswell, Li Deng, Jianfeng Gao, Xiaodong Liu, Rangan Ma-<br \/>\njumder, Andrew McNamara, Bhaskar Mitra, Tri Nguyen, et al. Ms marco: A human generated<br \/>\nmachine reading comprehension dataset. arXiv preprint arXiv:1611.09268, 2016.<\/p>\n<p>Deborah L Bandalos. Measurement theory and applications for the social sciences. Guilford Pub-<br \/>\nlications, 2018.<\/p>\n<p>Anirudh Bharadwaj, Chaitanya Malaviya, Nitish Joshi, and Mark Yatskar. Flattery, fluff, and<br \/>\nfog: Diagnosing and mitigating idiosyncratic biases in preference models. arXiv preprint<br \/>\narXiv:2506.05339, 2025.<\/p>\n<p>Su Lin Blodgett, Solon Barocas, Hal Daum\u00b4 e III, and Hanna Wallach. Language (technology) is<br \/>\npower: A critical survey of\u201d bias\u201d in nlp. arXiv preprint arXiv:2005.14050, 2020.<br \/>\nCati Brown, Tony Snodgrass, Susan J Kemper, Ruth Herman, and Michael A Covington. Auto-<br \/>\nmatic measurement of propositional idea density from part-of-speech tagging. Behavior research<br \/>\nmethods, 40(2):540\u2013545, 2008.<\/p>\n<p>Tuhin Chakrabarty, Philippe Laban, Divyansh Agarwal, Smaranda Muresan, and Chien-Sheng Wu.<br \/>\nArt or artifice? large language models and the false promise of creativity. In Proceedings of the<br \/>\n2024 CHI Conference on Human Factors in Computing Systems, pp. 1\u201334, 2024.<br \/>\nTuhin Chakrabarty, Philippe Laban, and Chien-Sheng Wu. Ai-slop to ai-polish? aligning lan-<br \/>\nguage models through edit-based writing rewards and test-time computation. arXiv preprint<br \/>\narXiv:2504.07532, 2025a.<\/p>\n<p>Tuhin Chakrabarty, Philippe Laban, and Chien-Sheng Wu. Can ai writing be salvaged? mitigat-<br \/>\ning idiosyncrasies and improving human-ai alignment in the writing process through edits. In<br \/>\nProceedings of the 2025 CHI Conference on Human Factors in Computing Systems, pp. 1\u201333,<br \/>\n2025b.<\/p>\n<p>10<br \/>\nPreprint. Under Review.<br \/>\nAaron Chatterji, Thomas Cunningham, David J Deming, Zoe Hitzig, Christopher Ong, Carl Yan<br \/>\nShan, and Kevin Wadman. How people use chatgpt. Working Paper 34255, National Bureau of<br \/>\nEconomic Research, September 2025. URL http:\/\/www.nber.org\/papers\/w34255.<\/p>\n<p>Charles LA Clarke and Laura Dietz. Llm-based relevance assessment still can\u2019t replace human<br \/>\nrelevance assessment. arXiv preprint arXiv:2412.17156, 2024.<\/p>\n<p>Edgar Dale and Jeanne S. Chall. A formula for predicting readability. Educational Research Bul-<br \/>\nletin, 27(1):11\u201328, 1948.<\/p>\n<p>DeepSeek-AI. Deepseek-r1: Incentivizing reasoning capability in llms via reinforcement learning,<br \/>\n2025. URL https:\/\/arxiv.org\/abs\/2501.12948.<\/p>\n<p>Aaron Fanous, Jacob Goldberg, Ank A Agarwal, Joanna Lin, Anson Zhou, Roxana Daneshjou, and<br \/>\nSanmi Koyejo. Syceval: Evaluating llm sycophancy. arXiv preprint arXiv:2502.08177, 2025.<\/p>\n<p>Rudolf Flesch. A new readability yardstick. Journal of Applied Psychology, 32(3):221\u2013233, 1948.<br \/>\ndoi: 10.1037\/h0057532.<\/p>\n<p>Sian Gooding, Lucia Lopez-Rivilla, and Edward Grefenstette. Writing as a testbed for open ended<br \/>\nagents. arXiv preprint arXiv:2503.19711, 2025.<\/p>\n<p>Robert Gunning. The Technique of Clear Writing. McGraw-Hill, 1952.<\/p>\n<p>Kunal Handa, Alex Tamkin, Miles McCain, Saffron Huang, Esin Durmus, Sarah Heck, Jared<br \/>\nMueller, Jerry Hong, Stuart Ritchie, Tim Belonax, et al. Which economic tasks are performed<br \/>\nwith ai? evidence from millions of claude conversations. arXiv preprint arXiv:2503.04761, 2025.<br \/>\nAbhimanyu Hans et al. Binoculars: Scalable detection of machine-generated text. In Proceedings<br \/>\nof the Conference on Empirical Methods in Natural Language Processing, 2024.<\/p>\n<p>Dirk Hovy. The enemy in your own camp: How well can we detect statistically-generated fake<br \/>\nreviews\u2013an adversarial study. In Proceedings of the 54th Annual Meeting of the Association for<br \/>\nComputational Linguistics (Volume 2: Short Papers), pp. 351\u2013356. Association for Computa-<br \/>\ntional Linguistics, 2016. doi: 10.18653\/v1\/P16-2057.<\/p>\n<p>Aaron Jaech, Adam Kalai, Adam Lerer, Adam Richardson, Ahmed El-Kishky, Aiden Low, Alec<br \/>\nHelyar, Aleksander Madry, Alex Beutel, Alex Carney, et al. Openai o1 system card. arXiv<br \/>\npreprint arXiv:2412.16720, 2024.<\/p>\n<p>Albert Q. Jiang, Alexandre Sablayrolles, Arthur Mensch, Chris Bamford, Devendra Singh Chap-<br \/>\nlot, Diego de las Casas, Florian Bressand, Gianna Lengyel, Guillaume Lample, Lucile Saulnier,<br \/>\nL\u00b4 elio Renard Lavaud, Marie-Anne Lachaux, Pierre Stock, Teven Le Scao, Thibaut Lavril,<br \/>\nThomas Wang, Timoth\u00b4 ee Lacroix, and William El Sayed. Mistral 7b, 2023. URL https:<br \/>\n\/\/arxiv.org\/abs\/2310.06825.<\/p>\n<p>J. Peter Kincaid, Robert P. Jr. Fishburne, Richard L. Rogers, and Brad S. Chissom. Derivation of<br \/>\nnew readability formulas (automated readability index, fog count and flesch reading ease formula)<br \/>\nfor navy enlisted personnel. Technical Report RBR-8-75, Naval Technical Training Command<br \/>\nMillington TN Research Branch, 1975.<\/p>\n<p>Md Tahmid Rahman Laskar, Cheng Chen, Shashi Bhushan Tn, et al. Are large language models<br \/>\nreliable judges? a study on the factuality evaluation capabilities of llms. In Proceedings of the<br \/>\nThird Workshop on Natural Language Generation, Evaluation, and Metrics (GEM), pp. 310\u2013316,<br \/>\n2023.<\/p>\n<p>Haitao Li, Qian Dong, Junjie Chen, Huixue Su, Yujia Zhou, Qingyao Ai, Ziyi Ye, and Yiqun<br \/>\nLiu. Llms-as-judges: a comprehensive survey on llm-based evaluation methods. arXiv preprint<br \/>\narXiv:2412.05579, 2024.<\/p>\n<p>Chin-Yew Lin. Rouge: A package for automatic evaluation of summaries. In Text summarization<br \/>\nbranches out, pp. 74\u201381, 2004.<\/p>\n<p>11<br \/>\nPreprint. Under Review.<br \/>\nYang Liu, Dan Iter, Yichong Xu, Shuohang Wang, Ruochen Xu, and Chenguang Zhu. G-eval: Nlg<br \/>\nevaluation using gpt-4 with better human alignment. arXiv preprint arXiv:2303.16634, 2023.<\/p>\n<p>Arwa Mahdawi. Ai-generated slop is slowly killing the internet, and nobody is trying to stop it.<br \/>\nThe Guardian, 8 Jan 2025. Available at: https:\/\/www.theguardian.com\/global\/<br \/>\ncommentisfree\/2025\/jan\/08\/ai-generated-slop-slowly-killing-\/<br \/>\ninternet-nobody-trying-to-stop-it (Accessed: March 25, 2025).<\/p>\n<p>Marian Marchal, Merel Scholman, Frances Yung, and Vera Demberg. Establishing annotation qual-<br \/>\nity in multi-label annotations. In Proceedings of the 29th international conference on computa-<br \/>\ntional linguistics, pp. 3659\u20133668, 2022.<\/p>\n<p>Philipp Mayring. Qualitative content analysis. Forum Qualitative Sozialforschung \/ Forum:<br \/>\nQualitative Social Research, 1(2), Jun. 2000. doi: 10.17169\/fqs-1.2.1089. URL https:<br \/>\n\/\/www.qualitative-research.net\/index.php\/fqs\/article\/view\/1089.<\/p>\n<p>Clara Meister, Tiago Pimentel, Patrick Haller, Lena J\u00a8 ager, Ryan Cotterell, and Roger Levy. Revisit-<br \/>\ning the uniform information density hypothesis. arXiv preprint arXiv:2109.11635, 2021.<\/p>\n<p>Cade Metz. A.i. search engines are better at answers than finding them. The New York<br \/>\nTimes, 11 Jun 2024. Available at: https:\/\/www.nytimes.com\/2024\/06\/11\/style\/<br \/>\nai-search-slop.html (Accessed: March 25, 2025).<\/p>\n<p>Eric Mitchell, Yoonho Lee, Alexander Khazatsky, Christopher D. Manning, and Chelsea Finn. De-<br \/>\ntectgpt: Zero-shot machine-generated text detection using probability curvature. In Proceedings<br \/>\nof the International Conference on Machine Learning, 2023.<\/p>\n<p>Bhuvanashree Murugadoss, Christian Poelitz, Ian Drosos, Vu Le, Nick McKenna, Carina Suzana<br \/>\nNegreanu, Chris Parnin, and Advait Sarkar. Evaluating the evaluator: Measuring llms\u2019 adherence<br \/>\nto task evaluation instructions, 2024. URL https:\/\/arxiv.org\/abs\/2408.08781.<\/p>\n<p>Ramya Namuduri, Yating Wu, Anshun Asher Zheng, Manya Wadhwa, Greg Durrett, and<br \/>\nJunyi Jessy Li. Qudsim: Quantifying discourse similarities in llm-generated text. arXiv preprint<br \/>\narXiv:2504.09373, 2025.<\/p>\n<p>Team OLMo, Pete Walsh, Luca Soldaini, Dirk Groeneveld, Kyle Lo, Shane Arora, Akshita Bha-<br \/>\ngia, Yuling Gu, Shengyi Huang, Matt Jordan, Nathan Lambert, Dustin Schwenk, Oyvind Tafjord,<br \/>\nTaira Anderson, David Atkinson, Faeze Brahman, Christopher Clark, Pradeep Dasigi, Nouha<br \/>\nDziri, Michal Guerquin, Hamish Ivison, Pang Wei Koh, Jiacheng Liu, Saumya Malik, William<br \/>\nMerrill, Lester James V. Miranda, Jacob Morrison, Tyler Murray, Crystal Nam, Valentina Py-<br \/>\natkin, Aman Rangapur, Michael Schmitz, Sam Skjonsberg, David Wadden, Christopher Wilhelm,<br \/>\nMichael Wilson, Luke Zettlemoyer, Ali Farhadi, Noah A. Smith, and Hannaneh Hajishirzi. 2<br \/>\nolmo 2 furious, 2025. URL https:\/\/arxiv.org\/abs\/2501.00656.<\/p>\n<p>OpenAI. How people are using chatgpt. https:\/\/openai.com\/index\/<br \/>\nhow-people-are-using-chatgpt\/, September 2025. Accessed: 2025-09-17.<\/p>\n<p>OpenAI, Josh Achiam, Steven Adler, Sandhini Agarwal, Lama Ahmad, Ilge Akkaya, Floren-<br \/>\ncia Leoni Aleman, Diogo Almeida, Janko Altenschmidt, Sam Altman, Shyamal Anadkat, Red<br \/>\nAvila, Igor Babuschkin, Suchir Balaji, Valerie Balcom, Paul Baltescu, Haiming Bao, Moham-<br \/>\nmad Bavarian, Jeff Belgum, Irwan Bello, Jake Berdine, Gabriel Bernadett-Shapiro, Christopher<br \/>\nBerner, Lenny Bogdonoff, Oleg Boiko, Madelaine Boyd, Anna-Luisa Brakman, Greg Brock-<br \/>\nman, Tim Brooks, Miles Brundage, Kevin Button, Trevor Cai, Rosie Campbell, Andrew Cann,<br \/>\nBrittany Carey, Chelsea Carlson, Rory Carmichael, Brooke Chan, Che Chang, Fotis Chantzis,<br \/>\nDerek Chen, Sully Chen, Ruby Chen, Jason Chen, Mark Chen, Ben Chess, Chester Cho, Casey<br \/>\nChu, Hyung Won Chung, Dave Cummings, Jeremiah Currier, Yunxing Dai, Cory Decareaux,<br \/>\nThomas Degry, Noah Deutsch, Damien Deville, Arka Dhar, David Dohan, Steve Dowling, Sheila<br \/>\nDunning, Adrien Ecoffet, Atty Eleti, Tyna Eloundou, David Farhi, Liam Fedus, Niko Felix,<br \/>\nSim\u00b4 on Posada Fishman, Juston Forte, Isabella Fulford, Leo Gao, Elie Georges, Christian Gib-<br \/>\nson, Vik Goel, Tarun Gogineni, Gabriel Goh, Rapha Gontijo-Lopes, Jonathan Gordon, Morgan<br \/>\nGrafstein, Scott Gray, Ryan Greene, Joshua Gross, Shixiang Shane Gu, Yufei Guo, Chris Hal-<br \/>\nlacy, Jesse Han, Jeff Harris, Yuchen He, Mike Heaton, Johannes Heidecke, Chris Hesse, Alan<br \/>\n12<\/p>\n<p>Preprint. Under Review.<\/p>\n<p>Hickey, Wade Hickey, Peter Hoeschele, Brandon Houghton, Kenny Hsu, Shengli Hu, Xin Hu,<br \/>\nJoost Huizinga, Shantanu Jain, Shawn Jain, Joanne Jang, Angela Jiang, Roger Jiang, Haozhun<br \/>\nJin, Denny Jin, Shino Jomoto, Billie Jonn, Heewoo Jun, Tomer Kaftan, \u0141ukasz Kaiser, Ali Ka-<br \/>\nmali, Ingmar Kanitscheider, Nitish Shirish Keskar, Tabarak Khan, Logan Kilpatrick, Jong Wook<br \/>\nKim, Christina Kim, Yongjik Kim, Jan Hendrik Kirchner, Jamie Kiros, Matt Knight, Daniel<br \/>\nKokotajlo, \u0141ukasz Kondraciuk, Andrew Kondrich, Aris Konstantinidis, Kyle Kosic, Gretchen<br \/>\nKrueger, Vishal Kuo, Michael Lampe, Ikai Lan, Teddy Lee, Jan Leike, Jade Leung, Daniel<br \/>\nLevy, Chak Ming Li, Rachel Lim, Molly Lin, Stephanie Lin, Mateusz Litwin, Theresa Lopez,<br \/>\nRyan Lowe, Patricia Lue, Anna Makanju, Kim Malfacini, Sam Manning, Todor Markov, Yaniv<br \/>\nMarkovski, Bianca Martin, Katie Mayer, Andrew Mayne, Bob McGrew, Scott Mayer McKinney,<br \/>\nChristine McLeavey, Paul McMillan, Jake McNeil, David Medina, Aalok Mehta, Jacob Menick,<br \/>\nLuke Metz, Andrey Mishchenko, Pamela Mishkin, Vinnie Monaco, Evan Morikawa, Daniel<br \/>\nMossing, Tong Mu, Mira Murati, Oleg Murk, David M\u00b4 ely, Ashvin Nair, Reiichiro Nakano, Ra-<br \/>\njeev Nayak, Arvind Neelakantan, Richard Ngo, Hyeonwoo Noh, Long Ouyang, Cullen O\u2019Keefe,<br \/>\nJakub Pachocki, Alex Paino, Joe Palermo, Ashley Pantuliano, Giambattista Parascandolo, Joel<br \/>\nParish, Emy Parparita, Alex Passos, Mikhail Pavlov, Andrew Peng, Adam Perelman, Filipe<br \/>\nde Avila Belbute Peres, Michael Petrov, Henrique Ponde de Oliveira Pinto, Michael, Pokorny,<br \/>\nMichelle Pokrass, Vitchyr H. Pong, Tolly Powell, Alethea Power, Boris Power, Elizabeth Proehl,<br \/>\nRaul Puri, Alec Radford, Jack Rae, Aditya Ramesh, Cameron Raymond, Francis Real, Kendra<br \/>\nRimbach, Carl Ross, Bob Rotsted, Henri Roussez, Nick Ryder, Mario Saltarelli, Ted Sanders,<br \/>\nShibani Santurkar, Girish Sastry, Heather Schmidt, David Schnurr, John Schulman, Daniel Sel-<br \/>\nsam, Kyla Sheppard, Toki Sherbakov, Jessica Shieh, Sarah Shoker, Pranav Shyam, Szymon Sidor,<br \/>\nEric Sigler, Maddie Simens, Jordan Sitkin, Katarina Slama, Ian Sohl, Benjamin Sokolowsky,<br \/>\nYang Song, Natalie Staudacher, Felipe Petroski Such, Natalie Summers, Ilya Sutskever, Jie Tang,<br \/>\nNikolas Tezak, Madeleine B. Thompson, Phil Tillet, Amin Tootoonchian, Elizabeth Tseng, Pre-<br \/>\nston Tuggle, Nick Turley, Jerry Tworek, Juan Felipe Cer\u00b4 on Uribe, Andrea Vallone, Arun Vi-<br \/>\njayvergiya, Chelsea Voss, Carroll Wainwright, Justin Jay Wang, Alvin Wang, Ben Wang, Jonathan<br \/>\nWard, Jason Wei, CJ Weinmann, Akila Welihinda, Peter Welinder, Jiayi Weng, Lilian Weng,<br \/>\nMatt Wiethoff, Dave Willner, Clemens Winter, Samuel Wolrich, Hannah Wong, Lauren Work-<br \/>\nman, Sherwin Wu, Jeff Wu, Michael Wu, Kai Xiao, Tao Xu, Sarah Yoo, Kevin Yu, Qiming<br \/>\nYuan, Wojciech Zaremba, Rowan Zellers, Chong Zhang, Marvin Zhang, Shengjia Zhao, Tianhao<br \/>\nZheng, Juntang Zhuang, William Zhuk, and Barret Zoph. Gpt-4 technical report, 2024. URL<br \/>\nhttps:\/\/arxiv.org\/abs\/2303.08774.<\/p>\n<p>Vishakh Padmakumar and He He. Does writing with language models reduce content diversity? In<br \/>\nProceedings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL),<br \/>\nToronto, Canada, 2023. Association for Computational Linguistics. URL https:\/\/arxiv.<br \/>\norg\/abs\/2309.05196.<\/p>\n<p>Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu. Bleu: a method for automatic<br \/>\nevaluation of machine translation. In Proceedings of the 40th annual meeting of the Association<br \/>\nfor Computational Linguistics, pp. 311\u2013318, 2002.<\/p>\n<p>Alec Radford, Jeffrey Wu, Rewon Child, David Luan, Dario Amodei, Ilya Sutskever, et al. Language<br \/>\nmodels are unsupervised multitask learners. OpenAI blog, 1(8):9, 2019.<\/p>\n<p>Sanjana Ramprasad and Byron C Wallace. Do automatic factuality metrics measure factuality? a<br \/>\ncritical evaluation. arXiv preprint arXiv:2411.16638, 2024.<\/p>\n<p>Jenna Russell, Marzena Karpinska, and Mohit Iyyer. People who frequently use chatgpt for writing<br \/>\ntasks are accurate and robust detectors of ai-generated text. arXiv preprint arXiv:2501.15654,<br \/>\n2025.<\/p>\n<p>Nikita Salkar, Thomas Trikalinos, Byron Wallace, and Ani Nenkova. Self-repetition in abstractive<br \/>\nneural summarizers. In Yulan He, Heng Ji, Sujian Li, Yang Liu, and Chua-Hui Chang (eds.),<br \/>\nProceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computa-<br \/>\ntional Linguistics and the 12th International Joint Conference on Natural Language Processing<br \/>\n(Volume 2: Short Papers), pp. 341\u2013350, Online only, November 2022. Association for Compu-<br \/>\ntational Linguistics. doi: 10.18653\/v1\/2022.aacl-short.42. URL https:\/\/aclanthology.<br \/>\norg\/2022.aacl-short.42\/.<\/p>\n<p>13<br \/>\nPreprint. Under Review.<br \/>\nA. O. Scott. A.i. is annoying now. the future may be worse. The New York Times,<br \/>\n24 Jul 2024. Available at: https:\/\/www.nytimes.com\/2024\/07\/24\/opinion\/<br \/>\nai-annoying-future.html (Accessed: March 25, 2025).<\/p>\n<p>Chantal Shaib, Joe Barrow, Jiuding Sun, Alexa F Siu, Byron C Wallace, and Ani Nenkova. Stan-<br \/>\ndardizing the measurement of text diversity: A tool and a comparative analysis of scores. arXiv<br \/>\npreprint arXiv:2403.00553, 2024a.<\/p>\n<p>Chantal Shaib, Yanai Elazar, Junyi Jessy Li, and Byron C Wallace. Detection and measurement of<br \/>\nsyntactic templates in generated text. In Yaser Al-Onaizan, Mohit Bansal, and Yun-Nung Chen<br \/>\n(eds.), Proceedings of the 2024 Conference on Empirical Methods in Natural Language Pro-<br \/>\ncessing, pp. 6416\u20136431, Miami, Florida, USA, November 2024b. Association for Computational<br \/>\nLinguistics. doi: 10.18653\/v1\/2024.emnlp-main.368. URL https:\/\/aclanthology.org\/<br \/>\n2024.emnlp-main.368\/.<\/p>\n<p>Gemma Team, Morgane Riviere, Shreya Pathak, Pier Giuseppe Sessa, Cassidy Hardin, Surya Bhu-<br \/>\npatiraju, L\u00b4 eonard Hussenot, Thomas Mesnard, Bobak Shahriari, Alexandre Ram\u00b4 e, Johan Fer-<br \/>\nret, Peter Liu, Pouya Tafti, Abe Friesen, Michelle Casbon, Sabela Ramos, Ravin Kumar, Char-<br \/>\nline Le Lan, Sammy Jerome, Anton Tsitsulin, Nino Vieillard, Piotr Stanczyk, Sertan Girgin,<br \/>\nNikola Momchev, Matt Hoffman, Shantanu Thakoor, Jean-Bastien Grill, Behnam Neyshabur,<br \/>\nOlivier Bachem, Alanna Walton, Aliaksei Severyn, Alicia Parrish, Aliya Ahmad, Allen Hutchi-<br \/>\nson, Alvin Abdagic, Amanda Carl, Amy Shen, Andy Brock, Andy Coenen, Anthony Laforge,<br \/>\nAntonia Paterson, Ben Bastian, Bilal Piot, Bo Wu, Brandon Royal, Charlie Chen, Chintu Kumar,<br \/>\nChris Perry, Chris Welty, Christopher A. Choquette-Choo, Danila Sinopalnikov, David Wein-<br \/>\nberger, Dimple Vijaykumar, Dominika Rogozi\u00b4 nska, Dustin Herbison, Elisa Bandy, Emma Wang,<br \/>\nEric Noland, Erica Moreira, Evan Senter, Evgenii Eltyshev, Francesco Visin, Gabriel Rasskin,<br \/>\nGary Wei, Glenn Cameron, Gus Martins, Hadi Hashemi, Hanna Klimczak-Pluci\u00b4 nska, Harleen<br \/>\nBatra, Harsh Dhand, Ivan Nardini, Jacinda Mein, Jack Zhou, James Svensson, Jeff Stanway, Jetha<br \/>\nChan, Jin Peng Zhou, Joana Carrasqueira, Joana Iljazi, Jocelyn Becker, Joe Fernandez, Joost van<br \/>\nAmersfoort, Josh Gordon, Josh Lipschultz, Josh Newlan, Ju yeong Ji, Kareem Mohamed, Kar-<br \/>\ntikeya Badola, Kat Black, Katie Millican, Keelin McDonell, Kelvin Nguyen, Kiranbir Sodhia,<br \/>\nKish Greene, Lars Lowe Sjoesund, Lauren Usui, Laurent Sifre, Lena Heuermann, Leticia Lago,<br \/>\nLilly McNealus, Livio Baldini Soares, Logan Kilpatrick, Lucas Dixon, Luciano Martins, Machel<br \/>\nReid, Manvinder Singh, Mark Iverson, Martin G\u00a8 orner, Mat Velloso, Mateo Wirth, Matt Davidow,<br \/>\nMatt Miller, Matthew Rahtz, Matthew Watson, Meg Risdal, Mehran Kazemi, Michael Moyni-<br \/>\nhan, Ming Zhang, Minsuk Kahng, Minwoo Park, Mofi Rahman, Mohit Khatwani, Natalie Dao,<br \/>\nNenshad Bardoliwalla, Nesh Devanathan, Neta Dumai, Nilay Chauhan, Oscar Wahltinez, Pankil<br \/>\nBotarda, Parker Barnes, Paul Barham, Paul Michel, Pengchong Jin, Petko Georgiev, Phil Culli-<br \/>\nton, Pradeep Kuppala, Ramona Comanescu, Ramona Merhej, Reena Jana, Reza Ardeshir Rokni,<br \/>\nRishabh Agarwal, Ryan Mullins, Samaneh Saadat, Sara Mc Carthy, Sarah Cogan, Sarah Perrin,<br \/>\nS\u00b4 ebastien M. R. Arnold, Sebastian Krause, Shengyang Dai, Shruti Garg, Shruti Sheth, Sue Ron-<br \/>\nstrom, Susan Chan, Timothy Jordan, Ting Yu, Tom Eccles, Tom Hennigan, Tomas Kocisky, Tulsee<br \/>\nDoshi, Vihan Jain, Vikas Yadav, Vilobh Meshram, Vishal Dharmadhikari, Warren Barkley, Wei<br \/>\nWei, Wenming Ye, Woohyun Han, Woosuk Kwon, Xiang Xu, Zhe Shen, Zhitao Gong, Zichuan<br \/>\nWei, Victor Cotruta, Phoebe Kirk, Anand Rao, Minh Giang, Ludovic Peran, Tris Warkentin, Eli<br \/>\nCollins, Joelle Barral, Zoubin Ghahramani, Raia Hadsell, D. Sculley, Jeanine Banks, Anca Dra-<br \/>\ngan, Slav Petrov, Oriol Vinyals, Jeff Dean, Demis Hassabis, Koray Kavukcuoglu, Clement Fara-<br \/>\nbet, Elena Buchatskaya, Sebastian Borgeaud, Noah Fiedel, Armand Joulin, Kathleen Kenealy,<br \/>\nRobert Dadashi, and Alek Andreev. Gemma 2: Improving open language models at a practical<br \/>\nsize, 2024. URL https:\/\/arxiv.org\/abs\/2408.00118.<\/p>\n<p>Guy Tevet and Jonathan Berant. Evaluating the evaluation of diversity in natural language genera-<br \/>\ntion. arXiv preprint arXiv:2004.02990, 2020.<\/p>\n<p>Kiran Tomlinson, Sonia Jaffe, Will Wang, Scott Counts, and Siddharth Suri. Working with ai:<br \/>\nMeasuring the occupational implications of generative ai. arXiv preprint arXiv:2507.07935, 2025.<br \/>\nJanyce Wiebe, Theresa Wilson, Rebecca Bruce, Matthew Bell, and Melanie Martin. Learning sub-<br \/>\njective language. Computational Linguistics, 30(3):277\u2013308, 09 2004. ISSN 0891-2017. doi:<br \/>\n10.1162\/0891201041850885. URL https:\/\/doi.org\/10.1162\/0891201041850885.<\/p>\n<p>14<br \/>\nPreprint. Under Review.<br \/>\nHaoyan Yang, Yixuan Wang, Xingyin Xu, Hanyuan Zhang, and Yirong Bian. Can we trust<br \/>\nllms? mitigate overconfidence bias in llms through knowledge transfer. arXiv preprint<br \/>\narXiv:2405.16856, 2024.<\/p>\n<p>Yusen Zhang, Sarkar Snigdha Sarathi Das, and Rui Zhang. Verbosity \u0338= veracity: Demystify ver-<br \/>\nbosity compensation behavior of large language models, 2024. URL https:\/\/arxiv.org\/<br \/>\nabs\/2411.07858.<br \/>\nLianmin Zheng, Wei-Lin Chiang, Ying Sheng, Siyuan Zhuang, Zhanghao Wu, Yonghao Zhuang,<br \/>\nZi Lin, Zhuohan Li, Dacheng Li, Eric Xing, et al. Judging llm-as-a-judge with mt-bench and<br \/>\nchatbot arena. Advances in neural information processing systems, 36:46595\u201346623, 2023<\/p>\n","protected":false},"excerpt":{"rendered":"<p>https:\/\/arxiv.org\/pdf\/2509.19163 REFERENCES Meta AI. Introducing llama 4: Advancing multimodal intelligence, 2024. URL https:\/\/ai. meta.com\/blog\/llama-4-multimodal-intelligence\/. Anthropic. Claude 3 model card addendum. Technical report, 2024. URL https:\/\/www-cdn. anthropic.com\/fed9cc193a14b84131812372d8d5857f8f304c52\/Model_ Card_Claude_3_Addendum.pdf. Accessed: 2024-12-30. Kyrtin Atreides and David J Kelley. Cognitive biases in natural language: Automatically detecting, differentiating, and measuring bias in text. Cognitive Systems Research, 88:101304, 2024. Payal Bajaj, [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-6015","post","type-post","status-publish","format-standard","hentry","category-uncategorised"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v17.0 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>How sloppy is your slop? | Artmaker Blog<\/title>\n<meta name=\"description\" content=\"How sloppy is your slop? | Artmaker Blog\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/\" \/>\n<meta property=\"og:locale\" content=\"en_GB\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"How sloppy is your slop? | Artmaker Blog\" \/>\n<meta property=\"og:description\" content=\"How sloppy is your slop? | Artmaker Blog\" \/>\n<meta property=\"og:url\" content=\"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/\" \/>\n<meta property=\"og:site_name\" content=\"Artmaker Blog\" \/>\n<meta property=\"article:published_time\" content=\"2025-09-26T06:34:40+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2025-09-26T06:38:08+00:00\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Bruce Sterling\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimated reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"13 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebSite\",\"@id\":\"https:\/\/toshareproject.it\/artmakerblog\/#website\",\"url\":\"https:\/\/toshareproject.it\/artmakerblog\/\",\"name\":\"Artmaker Blog\",\"description\":\"on Toshareproject.it - curated by Bruce Sterling\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/toshareproject.it\/artmakerblog\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"en-GB\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/#webpage\",\"url\":\"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/\",\"name\":\"How sloppy is your slop? | Artmaker Blog\",\"isPartOf\":{\"@id\":\"https:\/\/toshareproject.it\/artmakerblog\/#website\"},\"datePublished\":\"2025-09-26T06:34:40+00:00\",\"dateModified\":\"2025-09-26T06:38:08+00:00\",\"author\":{\"@id\":\"https:\/\/toshareproject.it\/artmakerblog\/#\/schema\/person\/6f20726ed2761431f3e0ff4e096c3085\"},\"description\":\"How sloppy is your slop? | Artmaker Blog\",\"breadcrumb\":{\"@id\":\"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/#breadcrumb\"},\"inLanguage\":\"en-GB\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/toshareproject.it\/artmakerblog\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"How sloppy is your slop?\"}]},{\"@type\":\"Person\",\"@id\":\"https:\/\/toshareproject.it\/artmakerblog\/#\/schema\/person\/6f20726ed2761431f3e0ff4e096c3085\",\"name\":\"Bruce Sterling\",\"image\":{\"@type\":\"ImageObject\",\"@id\":\"https:\/\/toshareproject.it\/artmakerblog\/#personlogo\",\"inLanguage\":\"en-GB\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/c390e8ed4db57a34278dcf667f928a643cf769a865c8a8632dcd310412bb9a99?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/c390e8ed4db57a34278dcf667f928a643cf769a865c8a8632dcd310412bb9a99?s=96&d=mm&r=g\",\"caption\":\"Bruce Sterling\"},\"description\":\"Art director at Share Festival, author and journalist\",\"sameAs\":[\"http:\/\/toshareproject.it\/tomorrowart\"],\"url\":\"https:\/\/toshareproject.it\/artmakerblog\/author\/brucesterling\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"How sloppy is your slop? | Artmaker Blog","description":"How sloppy is your slop? | Artmaker Blog","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/","og_locale":"en_GB","og_type":"article","og_title":"How sloppy is your slop? | Artmaker Blog","og_description":"How sloppy is your slop? | Artmaker Blog","og_url":"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/","og_site_name":"Artmaker Blog","article_published_time":"2025-09-26T06:34:40+00:00","article_modified_time":"2025-09-26T06:38:08+00:00","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Bruce Sterling","Estimated reading time":"13 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebSite","@id":"https:\/\/toshareproject.it\/artmakerblog\/#website","url":"https:\/\/toshareproject.it\/artmakerblog\/","name":"Artmaker Blog","description":"on Toshareproject.it - curated by Bruce Sterling","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/toshareproject.it\/artmakerblog\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"en-GB"},{"@type":"WebPage","@id":"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/#webpage","url":"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/","name":"How sloppy is your slop? | Artmaker Blog","isPartOf":{"@id":"https:\/\/toshareproject.it\/artmakerblog\/#website"},"datePublished":"2025-09-26T06:34:40+00:00","dateModified":"2025-09-26T06:38:08+00:00","author":{"@id":"https:\/\/toshareproject.it\/artmakerblog\/#\/schema\/person\/6f20726ed2761431f3e0ff4e096c3085"},"description":"How sloppy is your slop? | Artmaker Blog","breadcrumb":{"@id":"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/#breadcrumb"},"inLanguage":"en-GB","potentialAction":[{"@type":"ReadAction","target":["https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/toshareproject.it\/artmakerblog\/how-sloppy-is-your-slop\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/toshareproject.it\/artmakerblog\/"},{"@type":"ListItem","position":2,"name":"How sloppy is your slop?"}]},{"@type":"Person","@id":"https:\/\/toshareproject.it\/artmakerblog\/#\/schema\/person\/6f20726ed2761431f3e0ff4e096c3085","name":"Bruce Sterling","image":{"@type":"ImageObject","@id":"https:\/\/toshareproject.it\/artmakerblog\/#personlogo","inLanguage":"en-GB","url":"https:\/\/secure.gravatar.com\/avatar\/c390e8ed4db57a34278dcf667f928a643cf769a865c8a8632dcd310412bb9a99?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/c390e8ed4db57a34278dcf667f928a643cf769a865c8a8632dcd310412bb9a99?s=96&d=mm&r=g","caption":"Bruce Sterling"},"description":"Art director at Share Festival, author and journalist","sameAs":["http:\/\/toshareproject.it\/tomorrowart"],"url":"https:\/\/toshareproject.it\/artmakerblog\/author\/brucesterling\/"}]}},"_links":{"self":[{"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/posts\/6015","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/comments?post=6015"}],"version-history":[{"count":2,"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/posts\/6015\/revisions"}],"predecessor-version":[{"id":6017,"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/posts\/6015\/revisions\/6017"}],"wp:attachment":[{"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/media?parent=6015"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/categories?post=6015"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/toshareproject.it\/artmakerblog\/wp-json\/wp\/v2\/tags?post=6015"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}