※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2021-04-26 08:38:17
看板 Gossiping
作者 標題 [新聞] Stack Overflow發現用戶複製程式碼比例高
時間 Sun Apr 25 16:28:36 2021
1.媒體來源:
IThome
2.記者署名:
文/李建興
3.完整新聞標題:
複製貼上寫程式?你不孤單,Stack Overflow發現用戶複製程式碼比例高
4.完整新聞內文:
Stack Overflow分析網站上的複製事件,每4個用戶就會有1個,在進入網站5分鐘內,複
製網站上的部分內容
開發者論壇Stack Overflow近期作了一項研究,他們觀察使用者的複製行為,發現每4名
訪問Stack Overflow的使用者,就會有1位使用者在5分鐘內複製一些內容,而複製程式碼
的頻率是複製問題的10倍,更是複製評論的35倍,而且比起被接受的答案,沒有被接受的
答案整體有更多的複製量。
訪問Stack Overflow的使用者,就會有1位使用者在5分鐘內複製一些內容,而複製程式碼
的頻率是複製問題的10倍,更是複製評論的35倍,而且比起被接受的答案,沒有被接受的
答案整體有更多的複製量。
對於使用者在Stack Overflow網站上的程式碼複製行為,官方抱持正面態度,認為前人已
經辛苦工作,後人就不需要重新製作輪子,知識重用可以幫助使用者學習,並且減少工作
的挫敗感,更快地獲取到有用的程式碼。官方提到,知識重用一直以來就是Stack
經辛苦工作,後人就不需要重新製作輪子,知識重用可以幫助使用者學習,並且減少工作
的挫敗感,更快地獲取到有用的程式碼。官方提到,知識重用一直以來就是Stack
Overflow的重要基礎,也是能造就出強大開發者社群的關鍵。
Stack Overflow使用了自家的網頁追蹤工具,以自定義事件捕獲使用者在網站上的複製事
件,透過這些事件,官方能夠同時捕捉到多種屬性,包括標籤、問題答案、評論、程式碼
區塊或是純文字、複製者的聲譽、貼文分數、地區,以及該貼文是否被接受為問題的最佳
解答。Stack Overflow從2021年3月26日到2021年4月9日,整整收集了2個星期的資料,從
7,305,042篇貼文擷取到了40,623,987次複製事件。
件,透過這些事件,官方能夠同時捕捉到多種屬性,包括標籤、問題答案、評論、程式碼
區塊或是純文字、複製者的聲譽、貼文分數、地區,以及該貼文是否被接受為問題的最佳
解答。Stack Overflow從2021年3月26日到2021年4月9日,整整收集了2個星期的資料,從
7,305,042篇貼文擷取到了40,623,987次複製事件。
透過分析這些事件資料,官方可以了解複製Stack Overflow網站內容的使用者組成。網站
整體複製行為,與網站流量緊密相關,大多數的複製行為都出現在工作日的上班時間,來
自亞洲的使用者複製最多的內容占33%,歐洲則有30%,而北美為26%。
整體複製行為,與網站流量緊密相關,大多數的複製行為都出現在工作日的上班時間,來
自亞洲的使用者複製最多的內容占33%,歐洲則有30%,而北美為26%。
官方想要知道用戶聲譽和複製次數的關係,但由於產生複製事件的用戶,有86%是未登入
的使用者,也就是匿名的用戶,這些匿名用戶分為可能真的是不具帳戶的使用者,也可能
是有帳戶只是沒有登入,不過官方沒有辦法驗證其中的比例。
的使用者,也就是匿名的用戶,這些匿名用戶分為可能真的是不具帳戶的使用者,也可能
是有帳戶只是沒有登入,不過官方沒有辦法驗證其中的比例。
透過視覺化每個用戶的複製次數以及聲譽,的確可以看出當用戶的聲譽越高,複製次數就
越低的趨勢,雖然這樣的關係存在,但是由於沒有足夠的資料佐證,因此無法直接認定聲
譽較低的用戶,複製的次數一定比較多,但官方提到,學習中的開發人員通常聲譽較低,
隨著累積專業知識,會逐漸建立聲譽,而進階開發人員面對更為困難的挑戰,解法可能無
法從Stack Overflow複製而來。
越低的趨勢,雖然這樣的關係存在,但是由於沒有足夠的資料佐證,因此無法直接認定聲
譽較低的用戶,複製的次數一定比較多,但官方提到,學習中的開發人員通常聲譽較低,
隨著累積專業知識,會逐漸建立聲譽,而進階開發人員面對更為困難的挑戰,解法可能無
法從Stack Overflow複製而來。
而被答案提問者接受為最佳解答的貼文,被複製的次數就會比較多嗎?官方發現,有52.4
%的複製次數來自未被接受的答案,但是平均而言,每篇被接受的答案共獲得7次複製,
而不被接受的答案每篇則有5次複製,因此整體來說,不被接受的答案複製數量更多,但
是被接受的答案,擁有更高的知識重用性。
%的複製次數來自未被接受的答案,但是平均而言,每篇被接受的答案共獲得7次複製,
而不被接受的答案每篇則有5次複製,因此整體來說,不被接受的答案複製數量更多,但
是被接受的答案,擁有更高的知識重用性。
官方也發現,分數較高的貼文,被複製的次數也會跟著比較多。與使用者聲譽相同的問題
,大部分的貼文分數為零或是得分偏少,透過正規化網站上所有貼文的評分,從圖表(下
圖)可以看出在答案方面,分數1到1000區間組別的貼文,複製次數十分平均,而在問題
方面,1到5分的分組則是複製次數最多的,官方提到,這可能是用戶想要透過複製題目,
到其他地方提問獲得答案,所造成的現象。
,大部分的貼文分數為零或是得分偏少,透過正規化網站上所有貼文的評分,從圖表(下
圖)可以看出在答案方面,分數1到1000區間組別的貼文,複製次數十分平均,而在問題
方面,1到5分的分組則是複製次數最多的,官方提到,這可能是用戶想要透過複製題目,
到其他地方提問獲得答案,所造成的現象。
但是從複製次數和貼文得分分布圖來看,確實可以觀察到分數越高的貼文,複製次數越多
,這也代表這些知識更有被社群重用的價值。
值得注意的是,究竟使用者都在Stack Overflow上複製哪些程式語言的內容,令人驚訝的
是Python,這個標籤出現在4個前段標籤分組中,其中3個是資料科學的分組,包括
|python|pandas|、|python|pandas|dataframe|以及|python|matplotlib|,這顯示著
Python在程式開發與資料科學上的重要性。
5.完整新聞連結 (或短網址):
https://www.ithome.com.tw/news/143983
複製貼上寫程式?你不孤單,Stack Overflow發現用戶複製程式碼比例高 | iThome
Stack Overflow分析網站上的複製事件,每4個用戶就會有1個,在進入網站5分鐘內,複製網站上的部分內容 ...
Stack Overflow分析網站上的複製事件,每4個用戶就會有1個,在進入網站5分鐘內,複製網站上的部分內容 ...
6.備註:
以前就聽說很多人從 stackoverflow 拷貝程式碼
現在官方證實惹
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.104.114.106 (臺灣)
※ 文章代碼(AID): #1WXIWsyp (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1619339318.A.F33.html
→ : 寫程式(X debug(O1F 04/25 16:30
推 : 本來就很正常吧 很多情況下需要的就是那個邏輯2F 04/25 16:30
推 : 謝謝你 stackoverflow3F 04/25 16:30
→ : 複製下來再自己改就好了 你幹嘛從頭開始打一樣的東西4F 04/25 16:30
推 : 很正常吧,有些程式碼是經過網友共同檢視,也踩過坑5F 04/25 16:30
→ : 的,比較自己要重新寫過來得好
→ : 的,比較自己要重新寫過來得好
推 : 所有語言都是面向google的語言7F 04/25 16:31
推 : 驚人的發現8F 04/25 16:31
→ : 有啥問題,我python就是在stack學的,copy犯法喔9F 04/25 16:31
推 : 這不是廢話嗎...複製下來之後改成自己要的比從頭打一樣的10F 04/25 16:32
推 : 啊都看到人家寫好的當然複製啊 自己抄一遍更浪費時間11F 04/25 16:32
→ : 東西省時省力啊12F 04/25 16:32
→ : 你都寫好了我幹嘛改 又不是寫論文 0.013F 04/25 16:32
推 : 碼農啊14F 04/25 16:32
推 : XDDDD 這不是廢話嗎15F 04/25 16:32
→ : 就跟在IDE裡面使用 auto-completion 的機能是一樣的16F 04/25 16:32
推 : 非最佳解答複製比較高很真實17F 04/25 16:32
推 : 查官方文件(X 去stackoverflow複製(O18F 04/25 16:33
→ : 因為最佳的都想真的教會你 其他解答直接甩答案出來19F 04/25 16:33
→ : 不然呢 看完自己寫?20F 04/25 16:33
推 : 不然要叫我重頭打喔?21F 04/25 16:33
推 : Design Patterns 還直接把常用的設計模板給你抄22F 04/25 16:34
推 : 能用就好啊23F 04/25 16:35
推 : 直接甩答案出來XDD24F 04/25 16:35
→ : 不然要雙螢幕用手打唷25F 04/25 16:35
→ : 寫程式本來就是複製貼上26F 04/25 16:35
→ : 不然勒,程式會動就好27F 04/25 16:35
推 : 正常啊,重造輪子真的夠蠢,還可能造出一個四不像28F 04/25 16:36
→ : 跟數學背公式一樣 一堆東西本來就是複製貼上29F 04/25 16:36
推 : 有寫好的模板可用,再拿來修改就好了,還自己重刻幹嘛30F 04/25 16:36
推 : 這跟數學背公式當然不一樣了31F 04/25 16:37
→ : 會的東西 直接貼 節省時間32F 04/25 16:37
→ : no shit33F 04/25 16:37
→ : @override34F 04/25 16:37
→ : 光coding style 就絕對要改了35F 04/25 16:37
→ : 要的是code的流程 實際implement多半會有差別
→ : 如果都不改的話,那就是該寫成function
→ : 要的是code的流程 實際implement多半會有差別
→ : 如果都不改的話,那就是該寫成function
推 : 現在有人寫程式是完全自己開發不複製貼上的嗎38F 04/25 16:39
推 : 寫成function 沒問題r 最佳解到哪都不會改變 直接貼r39F 04/25 16:39
→ : 閉門造車不一定會比較好40F 04/25 16:40
推 : 但就算是要寫一個新的function 也不可能直接貼上41F 04/25 16:40
→ : 除非這是在學校要交作業
→ : 實務上你merge前有太多要整理好的東西
→ : 除非這是在學校要交作業
→ : 實務上你merge前有太多要整理好的東西
噓 : 廢話44F 04/25 16:40
噓 : 廢話嘛45F 04/25 16:41
噓 : 這不是廢話貓46F 04/25 16:43
→ : 嗎
官方證實的廢話→ : 嗎
推 : Coding style不用特別改啊48F 04/25 16:43
→ : ide能做到大家都是一樣的format 小修改比從頭幹快ㄅ49F 04/25 16:43
→ : 若是舉python需要改代表你寫的很不py50F 04/25 16:43
→ : 大不了我抄下一篇design pattern好一點的
→ : 大不了我抄下一篇design pattern好一點的
→ : 變數命名風格什麼的52F 04/25 16:44
→ : int a int b int c 吧53F 04/25 16:45
推 : 複製貼上後改那些是本來就要做的事 不用再特別贅述吧54F 04/25 16:47
→ : 找不到可以直接用的程式碼通常代表你不懂自己該找什55F 04/25 16:47
→ : 麼= =
→ : 麼= =
推 : 學校教程式還抓抄襲就有點好笑57F 04/25 16:47
推 : 背公式最快 那科都一樣58F 04/25 16:47
→ : 需要改不是你找法太爛就是答案寫太爛59F 04/25 16:49
推 : 文組的才會覺得這種行為是抄襲ㄅㄏㄏ60F 04/25 16:49
推 : 唯一會有法律問題的就是call到禁止商業使用的套件61F 04/25 16:51
→ : 這就stackoverflow價值阿 網站掛掉全球90%工程師就沒產出62F 04/25 16:51
→ : 有時候他們會丟一些特別的api來解 本來就該自己判斷惹63F 04/25 16:52
推 : 這網站關了不知道有多少人要失業64F 04/25 16:52
→ : 一堆支那的爬蟲網也在爬 然後再搞很爛的中譯 糞65F 04/25 16:54
→ : XDDDDD66F 04/25 16:57
推 : 我都複製完貼到codepen去改 嘻嘻67F 04/25 16:58
推 : 重新製作輪子是reinvent the wheel的直翻嗎...68F 04/25 16:59
推 : 不複製的比較87 人家寫的比較好你還要自己刻還有bug69F 04/25 17:00
推 : 尬麻自己造輪子,人家都寫好了70F 04/25 17:00
推 : 之前愚人節還故意改成付錢才能複製程式碼 嚇死&激怒全世界71F 04/25 17:01
→ : 的工程師 XDDD
→ : 的工程師 XDDD
推 : 這新聞到底啥廢文==73F 04/25 17:03
推 : 無償收到好處自然也會想主動回饋吧,我也上過簡單能跑片段74F 04/25 17:04
推 : 哈哈 是我啦75F 04/25 17:07
推 : 合理啊76F 04/25 17:15
推 : 偉大的stackoverflow77F 04/25 17:24
推 : 別人寫好好的給你不複製是傻子吧78F 04/25 17:25
→ : 搞工程又不是搞藝術...79F 04/25 17:33
推 : 被發現了80F 04/25 17:36
→ : 要不然是上去當ptt看廢文的嗎81F 04/25 17:41
推 : 不然?程式就是經驗法則,沒在跟你天天原創的82F 04/25 17:48
→ : 有些不用抄的難道天天重新造輪子嗎83F 04/25 17:51
推 : 案子哪有時間全部重造84F 04/25 17:56
噓 : 哇!驚奇大發現85F 04/25 18:10
推 : 這很正常吧! 找到一段可用程式 當然是copy下來再改啊!86F 04/25 18:21
推 : 反觀奇摩知識家87F 04/25 18:21
推 : 自己寫很累啊88F 04/25 18:27
→ : 這是不需要統計就可以預見的 寫code又不是在做研究89F 04/25 18:44
→ : 別人有最佳解法 你不用堅持自己去解叫做犯賤自以為
→ : 那麼愛自幹乾脆連標準函式庫都不要用 那也是別人寫好的
→ : 別人有最佳解法 你不用堅持自己去解叫做犯賤自以為
→ : 那麼愛自幹乾脆連標準函式庫都不要用 那也是別人寫好的
推 : 阿不然咧,這世上所有人工的東西就是一次又一次複製來的92F 04/25 18:46
推 : 勵志好文93F 04/25 19:00
推 : 面試官 :請你現場造輪子94F 04/25 19:21
推 : 為什麼複製他們會知道?95F 04/25 19:30
Stackoverflow 自幹 tracker 啊推 : 複製很正常吧 又不是作文比賽96F 04/25 19:32
推 : Python 嘻嘻97F 04/25 19:37
推 : 現在才發現?98F 04/25 19:39
推 : 啊我都上來找答案了,找到了還不抄那不然要幹嘛99F 04/25 19:54
推 : 到了業界就知道,功能出來最重要誰管你code寫怎樣100F 04/25 20:01
推 : 感謝各路神通廣大的網友!101F 04/25 20:06
推 : 有command的數據嗎? 應該也很高102F 04/25 20:23
推 : 阿不就都踹踹看 不然慢慢查官方文件103F 04/25 20:24
推 : 阿 不然是要去那裏幹嘛104F 04/25 20:32
推 : 複製又怎樣 複製到自己的程式碼裡面還能正確的跑多少105F 04/25 21:04
→ : 也知道運作原理吧 且工作要的是結果沒人要理你怎麼寫
※ 編輯: Neisseria (112.104.114.106 臺灣), 04/25/2021 21:18:04→ : 也知道運作原理吧 且工作要的是結果沒人要理你怎麼寫
推 : 不是 阿怎會跟複製問題來做比較? 進去要不就看 要試程式碼107F 04/25 21:21
→ : 就複製 誰沒事他媽會複製問題
→ : 就複製 誰沒事他媽會複製問題
推 : 社群本來就是為了互相幫助產生的啊109F 04/25 21:31
推 : 請懷著感恩的心使用吧110F 04/25 21:40
推 : 亞洲人愛抄昨夜111F 04/25 22:35
→ : #put your comment here112F 04/25 22:52
→ : 原始問題就錯的程式碼 複製幹嘛啦XD
→ : 然後很多接受的答案已經過時了 往下翻才有新的
→ : 原始問題就錯的程式碼 複製幹嘛啦XD
→ : 然後很多接受的答案已經過時了 往下翻才有新的
推 : 碼農只會越來越多115F 04/25 23:05
→ : 一個是複製,另外三個是沒有找到要的答案116F 04/25 23:24
推 : 沒有stackoverflow真的會世界末日117F 04/25 23:46
→ : 不好意思 有些是我啦118F 04/25 23:56
推 : 自己打code邏輯死掉的話就沒有產出了119F 04/26 00:08
推 : 碼農生命線120F 04/26 01:07
→ : 用library 也是一樣概念啊 幹嘛自己刻輪子121F 04/26 01:58
推 : 每個我都試試看122F 04/26 02:14
--
※ 看板: Gossiping 文章推薦值: 0 目前人氣: 0 累積人氣: 463
回列表(←)
分享