顯示廣告
隱藏 ✕
※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2021-04-26 08:38:17
看板 Gossiping
作者 Neisseria (Neisseria)
標題 [新聞] Stack Overflow發現用戶複製程式碼比例高
時間 Sun Apr 25 16:28:36 2021


1.媒體來源:
IThome


2.記者署名:
文/李建興


3.完整新聞標題:
複製貼上寫程式?你不孤單,Stack Overflow發現用戶複製程式碼比例高


4.完整新聞內文:
Stack Overflow分析網站上的複製事件,每4個用戶就會有1個,在進入網站5分鐘內,複
製網站上的部分內容

開發者論壇Stack Overflow近期作了一項研究,他們觀察使用者的複製行為,發現每4名
訪問Stack Overflow的使用者,就會有1位使用者在5分鐘內複製一些內容,而複製程式碼
的頻率是複製問題的10倍,更是複製評論的35倍,而且比起被接受的答案,沒有被接受的
答案整體有更多的複製量。


對於使用者在Stack Overflow網站上的程式碼複製行為,官方抱持正面態度,認為前人已
經辛苦工作,後人就不需要重新製作輪子,知識重用可以幫助使用者學習,並且減少工作
的挫敗感,更快地獲取到有用的程式碼。官方提到,知識重用一直以來就是Stack

Overflow的重要基礎,也是能造就出強大開發者社群的關鍵。

Stack Overflow使用了自家的網頁追蹤工具,以自定義事件捕獲使用者在網站上的複製事
件,透過這些事件,官方能夠同時捕捉到多種屬性,包括標籤、問題答案、評論、程式碼
區塊或是純文字、複製者的聲譽、貼文分數、地區,以及該貼文是否被接受為問題的最佳
解答。Stack Overflow從2021年3月26日到2021年4月9日,整整收集了2個星期的資料,從
7,305,042篇貼文擷取到了40,623,987次複製事件。


透過分析這些事件資料,官方可以了解複製Stack Overflow網站內容的使用者組成。網站
整體複製行為,與網站流量緊密相關,大多數的複製行為都出現在工作日的上班時間,來
自亞洲的使用者複製最多的內容占33%,歐洲則有30%,而北美為26%。


官方想要知道用戶聲譽和複製次數的關係,但由於產生複製事件的用戶,有86%是未登入
的使用者,也就是匿名的用戶,這些匿名用戶分為可能真的是不具帳戶的使用者,也可能
是有帳戶只是沒有登入,不過官方沒有辦法驗證其中的比例。


透過視覺化每個用戶的複製次數以及聲譽,的確可以看出當用戶的聲譽越高,複製次數就
越低的趨勢,雖然這樣的關係存在,但是由於沒有足夠的資料佐證,因此無法直接認定聲
譽較低的用戶,複製的次數一定比較多,但官方提到,學習中的開發人員通常聲譽較低,
隨著累積專業知識,會逐漸建立聲譽,而進階開發人員面對更為困難的挑戰,解法可能無
法從Stack Overflow複製而來。


而被答案提問者接受為最佳解答的貼文,被複製的次數就會比較多嗎?官方發現,有52.4
%的複製次數來自未被接受的答案,但是平均而言,每篇被接受的答案共獲得7次複製,
而不被接受的答案每篇則有5次複製,因此整體來說,不被接受的答案複製數量更多,但
是被接受的答案,擁有更高的知識重用性。


官方也發現,分數較高的貼文,被複製的次數也會跟著比較多。與使用者聲譽相同的問題
,大部分的貼文分數為零或是得分偏少,透過正規化網站上所有貼文的評分,從圖表(下
圖)可以看出在答案方面,分數1到1000區間組別的貼文,複製次數十分平均,而在問題
方面,1到5分的分組則是複製次數最多的,官方提到,這可能是用戶想要透過複製題目,
到其他地方提問獲得答案,所造成的現象。


但是從複製次數和貼文得分分布圖來看,確實可以觀察到分數越高的貼文,複製次數越多
,這也代表這些知識更有被社群重用的價值。

值得注意的是,究竟使用者都在Stack Overflow上複製哪些程式語言的內容,令人驚訝的
是Python,這個標籤出現在4個前段標籤分組中,其中3個是資料科學的分組,包括
|python|pandas|、|python|pandas|dataframe|以及|python|matplotlib|,這顯示著
Python在程式開發與資料科學上的重要性。


5.完整新聞連結 (或短網址):
https://www.ithome.com.tw/news/143983
複製貼上寫程式?你不孤單,Stack Overflow發現用戶複製程式碼比例高 | iThome
[圖]
Stack Overflow分析網站上的複製事件,每4個用戶就會有1個,在進入網站5分鐘內,複製網站上的部分內容 ...

 


6.備註:
以前就聽說很多人從 stackoverflow 拷貝程式碼
現在官方證實惹

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.104.114.106 (臺灣)
※ 文章代碼(AID): #1WXIWsyp (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1619339318.A.F33.html
jacky40383: 寫程式(X   debug(O1F 04/25 16:30
abadjoke: 本來就很正常吧 很多情況下需要的就是那個邏輯2F 04/25 16:30
KhePri: 謝謝你 stackoverflow3F 04/25 16:30
abadjoke: 複製下來再自己改就好了 你幹嘛從頭開始打一樣的東西4F 04/25 16:30
zephyrhymn: 很正常吧,有些程式碼是經過網友共同檢視,也踩過坑5F 04/25 16:30
zephyrhymn: 的,比較自己要重新寫過來得好
skywalker019: 所有語言都是面向google的語言7F 04/25 16:31
KGarnett05: 驚人的發現8F 04/25 16:31
wario2014: 有啥問題,我python就是在stack學的,copy犯法喔9F 04/25 16:31
arrenwu: 這不是廢話嗎...複製下來之後改成自己要的比從頭打一樣的10F 04/25 16:32
yzkeroro: 啊都看到人家寫好的當然複製啊 自己抄一遍更浪費時間11F 04/25 16:32
arrenwu: 東西省時省力啊12F 04/25 16:32
fly0204: 你都寫好了我幹嘛改 又不是寫論文 0.013F 04/25 16:32
popy8789: 碼農啊14F 04/25 16:32
jhangyu: XDDDD 這不是廢話嗎15F 04/25 16:32
arrenwu: 就跟在IDE裡面使用 auto-completion 的機能是一樣的16F 04/25 16:32
tzyysang: 非最佳解答複製比較高很真實17F 04/25 16:32
alihue: 查官方文件(X  去stackoverflow複製(O18F 04/25 16:33
tzyysang: 因為最佳的都想真的教會你 其他解答直接甩答案出來19F 04/25 16:33
clamperni: 不然呢 看完自己寫?20F 04/25 16:33
mathrew: 不然要叫我重頭打喔?21F 04/25 16:33
arrenwu: Design Patterns 還直接把常用的設計模板給你抄22F 04/25 16:34
rhox: 能用就好啊23F 04/25 16:35
jhangyu: 直接甩答案出來XDD24F 04/25 16:35
Tchachavsky: 不然要雙螢幕用手打唷25F 04/25 16:35
wisdom: 寫程式本來就是複製貼上26F 04/25 16:35
ZhouGongJin: 不然勒,程式會動就好27F 04/25 16:35
lianpig5566: 正常啊,重造輪子真的夠蠢,還可能造出一個四不像28F 04/25 16:36
PONANZA: 跟數學背公式一樣 一堆東西本來就是複製貼上29F 04/25 16:36
slimu0001: 有寫好的模板可用,再拿來修改就好了,還自己重刻幹嘛30F 04/25 16:36
arrenwu: 這跟數學背公式當然不一樣了31F 04/25 16:37
PONANZA: 會的東西 直接貼 節省時間32F 04/25 16:37
BF109Pilot: no shit33F 04/25 16:37
rootpresent: @override34F 04/25 16:37
arrenwu: 光coding style 就絕對要改了35F 04/25 16:37
arrenwu: 要的是code的流程 實際implement多半會有差別
arrenwu: 如果都不改的話,那就是該寫成function
devilfruit: 現在有人寫程式是完全自己開發不複製貼上的嗎38F 04/25 16:39
PONANZA: 寫成function 沒問題r 最佳解到哪都不會改變 直接貼r39F 04/25 16:39
devilfruit: 閉門造車不一定會比較好40F 04/25 16:40
arrenwu: 但就算是要寫一個新的function 也不可能直接貼上41F 04/25 16:40
arrenwu: 除非這是在學校要交作業
arrenwu: 實務上你merge前有太多要整理好的東西
deeeplove: 廢話44F 04/25 16:40
mikemagic88: 廢話嘛45F 04/25 16:41
ruokcnn: 這不是廢話貓46F 04/25 16:43
ruokcnn: 嗎
官方證實的廢話
yoyo178134: Coding style不用特別改啊48F 04/25 16:43
PONANZA: ide能做到大家都是一樣的format 小修改比從頭幹快ㄅ49F 04/25 16:43
yoyo178134: 若是舉python需要改代表你寫的很不py50F 04/25 16:43
yoyo178134: 大不了我抄下一篇design pattern好一點的
devilkool: 變數命名風格什麼的52F 04/25 16:44
mikemagic88: int a int b int c 吧53F 04/25 16:45
PONANZA: 複製貼上後改那些是本來就要做的事 不用再特別贅述吧54F 04/25 16:47
lucifiel1618: 找不到可以直接用的程式碼通常代表你不懂自己該找什55F 04/25 16:47
lucifiel1618: 麼= =
oddoneislove: 學校教程式還抓抄襲就有點好笑57F 04/25 16:47
netio: 背公式最快 那科都一樣58F 04/25 16:47
lucifiel1618: 需要改不是你找法太爛就是答案寫太爛59F 04/25 16:49
QBRoboT: 文組的才會覺得這種行為是抄襲ㄅㄏㄏ60F 04/25 16:49
PONANZA: 唯一會有法律問題的就是call到禁止商業使用的套件61F 04/25 16:51
max9527: 這就stackoverflow價值阿 網站掛掉全球90%工程師就沒產出62F 04/25 16:51
PONANZA: 有時候他們會丟一些特別的api來解 本來就該自己判斷惹63F 04/25 16:52
fishfish1314: 這網站關了不知道有多少人要失業64F 04/25 16:52
PONANZA: 一堆支那的爬蟲網也在爬 然後再搞很爛的中譯 糞65F 04/25 16:54
Philethan: XDDDDD66F 04/25 16:57
XDDDpupu5566: 我都複製完貼到codepen去改 嘻嘻67F 04/25 16:58
kotorikawaii: 重新製作輪子是reinvent the wheel的直翻嗎...68F 04/25 16:59
AgentSkye56: 不複製的比較87 人家寫的比較好你還要自己刻還有bug69F 04/25 17:00
jackycheny: 尬麻自己造輪子,人家都寫好了70F 04/25 17:00
louner: 之前愚人節還故意改成付錢才能複製程式碼 嚇死&激怒全世界71F 04/25 17:01
louner: 的工程師 XDDD
enemyli: 這新聞到底啥廢文==73F 04/25 17:03
atobela: 無償收到好處自然也會想主動回饋吧,我也上過簡單能跑片段74F 04/25 17:04
qk3380888: 哈哈 是我啦75F 04/25 17:07
chaoannricar: 合理啊76F 04/25 17:15
cty78221: 偉大的stackoverflow77F 04/25 17:24
YOLOO: 別人寫好好的給你不複製是傻子吧78F 04/25 17:25
ad1339: 搞工程又不是搞藝術...79F 04/25 17:33
s81048112: 被發現了80F 04/25 17:36
yeh0416: 要不然是上去當ptt看廢文的嗎81F 04/25 17:41
edq02yc: 不然?程式就是經驗法則,沒在跟你天天原創的82F 04/25 17:48
g5637128: 有些不用抄的難道天天重新造輪子嗎83F 04/25 17:51
Keatonzeus: 案子哪有時間全部重造84F 04/25 17:56
elliotpvt: 哇!驚奇大發現85F 04/25 18:10
riker729: 這很正常吧! 找到一段可用程式 當然是copy下來再改啊!86F 04/25 18:21
will1118: 反觀奇摩知識家87F 04/25 18:21
gin10791: 自己寫很累啊88F 04/25 18:27
WunoW: 這是不需要統計就可以預見的 寫code又不是在做研究89F 04/25 18:44
WunoW: 別人有最佳解法 你不用堅持自己去解叫做犯賤自以為
WunoW: 那麼愛自幹乾脆連標準函式庫都不要用 那也是別人寫好的
ysopd: 阿不然咧,這世上所有人工的東西就是一次又一次複製來的92F 04/25 18:46
amethystboy: 勵志好文93F 04/25 19:00
WWIII: 面試官 :請你現場造輪子94F 04/25 19:21
ksxo: 為什麼複製他們會知道?95F 04/25 19:30
Stackoverflow 自幹 tracker 啊
lfi: 複製很正常吧 又不是作文比賽96F 04/25 19:32
reemir: Python 嘻嘻97F 04/25 19:37
sumsum: 現在才發現?98F 04/25 19:39
jyunwei: 啊我都上來找答案了,找到了還不抄那不然要幹嘛99F 04/25 19:54
cacasi: 到了業界就知道,功能出來最重要誰管你code寫怎樣100F 04/25 20:01
Mubing: 感謝各路神通廣大的網友!101F 04/25 20:06
king22649: 有command的數據嗎? 應該也很高102F 04/25 20:23
ches728ter: 阿不就都踹踹看 不然慢慢查官方文件103F 04/25 20:24
followwar: 阿 不然是要去那裏幹嘛104F 04/25 20:32
Gankosakae: 複製又怎樣 複製到自己的程式碼裡面還能正確的跑多少105F 04/25 21:04
Gankosakae: 也知道運作原理吧 且工作要的是結果沒人要理你怎麼寫
※ 編輯: Neisseria (112.104.114.106 臺灣), 04/25/2021 21:18:04
kyfish: 不是 阿怎會跟複製問題來做比較? 進去要不就看 要試程式碼107F 04/25 21:21
kyfish: 就複製 誰沒事他媽會複製問題
lazulum: 社群本來就是為了互相幫助產生的啊109F 04/25 21:31
lovegensokyo: 請懷著感恩的心使用吧110F 04/25 21:40
tprktpps: 亞洲人愛抄昨夜111F 04/25 22:35
x94fujo6: #put your comment here112F 04/25 22:52
x94fujo6: 原始問題就錯的程式碼 複製幹嘛啦XD
x94fujo6: 然後很多接受的答案已經過時了 往下翻才有新的
junwen: 碼農只會越來越多115F 04/25 23:05
achi56: 一個是複製,另外三個是沒有找到要的答案116F 04/25 23:24
azzc1031: 沒有stackoverflow真的會世界末日117F 04/25 23:46
ssivart: 不好意思 有些是我啦118F 04/25 23:56
ap909278410: 自己打code邏輯死掉的話就沒有產出了119F 04/26 00:08
mystage: 碼農生命線120F 04/26 01:07
Zepho: 用library 也是一樣概念啊 幹嘛自己刻輪子121F 04/26 01:58
adsl9527: 每個我都試試看122F 04/26 02:14

--
※ 看板: Gossiping 文章推薦值: 0 目前人氣: 0 累積人氣: 463 
分享網址: 複製 已複製
1樓 時間: 2021-04-25 21:59:27 (台灣)
  04-25 21:59 TW
這個網站居然監視跟複製網站用戶的鍵盤紀錄??
不然怎麼會知道網站用戶複製程式嗎??
2樓 時間: 2021-04-26 11:10:37 (台灣)
     (編輯過) TW
用JS偵測使用者鍵盤或滑鼠行為,加上一點cookie回傳資料就可以,不是很困難的技術
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇