Anthropic ci dice che l'AI per gli sviluppatori e' pericolosa

In other news, l’acqua e’ calda. Ma effettivamente il fatto che ce lo dica anthropic (quelli di Claude, sola il miglior modello per agentic AI al momento sul mercato, lo uso pure io per darvi un idea) e’ un ottimo segnale per quelle aziende gestite da capre ignoranti che si fanno abbindolare dal marketing di varie AI companies che sono borderline scammers.

Sono tentato di linkarlo nel social interno aziendale solo per vedere quanto posso andare vicino al licenziamento ma vorrei avere una cazzo di promozione dopo 3 anni che mi dicono “eeeh, quest’anno c’era vento” e me la negano :asd:

1 Like

Our findings suggest that AI-enhanced productivity is not a shortcut to competence

Grazie al cazzo :asd:

3 Likes

Eh, grazie al cazzo per chi e’ un senor developer

ma per chi e’ un CEO va scritto in grassetto temo.

Comunque battute a parte, per chi non ha tempo/voglia di leggerselo tutto, la parte interessante imho e’ questa:

Discussion

Our main finding is that using AI to complete tasks that require a new skill (i.e., knowledge of a new Python library) reduces skill formation. In a randomized controlled trial, participants were assigned to the treatment condition (using an AI assistant, web search, and instructions) or the control condition (completing tasks with web search and instructions alone). The erosion of conceptual understanding, code reading, and debugging skills that we measured among participants using AI assistance suggests that workers acquiring new skills should be mindful of their reliance on AI during the learning process. Among participants who use AI, we find a stark divide in skill formation outcomes between high-scoring interaction patterns (65%-86% quiz score) vs low-scoring interaction patterns (24%-39% quiz score). The high scorers only asked AI conceptual questions instead of code generation or asked for explanations to accompany generated code; these usage patterns demonstrate a high level of cognitive engagement.

Contrary to our initial hypothesis, we did not observe a significant performance boost in task completion in our main study. While using AI improved the average completion time of the task, the improvement in efficiency was not significant in our study, despite the AI Assistant being able to generate the complete code solution when prompted. Our qualitative analysis reveals that our finding is largely due to the heterogeneity in how participants decide to use AI during the task. There is a group of participants who relied on AI to generate all the code and never asked conceptual questions or for explanations. This group finished much faster than the control group (19.5 minutes vs 23 minutes), but this group only accounted for around 20% of the participants in the treatment group. Other participants in the AI group who asked a large number of queries (e.g., 15 queries), spent a long time composing queries (e.g., 10 minutes), or asked for follow-up explanations, raised the average task completion time. These contrasting patterns of AI usage suggest that accomplishing a task with new knowledge or skills does not necessarily lead to the same productive gains as tasks that require only existing knowledge.

Together, our results suggest that the aggressive incorporation of AI into the workplace can have negative impacts on the professional development workers if they do not remain cognitatively engaged. Given time constraints and organizational pressures, junior developers or other professionals may rely on AI to complete tasks as fast as possible at the cost of real skill development. Furthermore, we found that the biggest difference in test scores is between the debugging questions. This suggests that as companies transition to more AI code writing with human supervision, humans may not possess the necessary skills to validate and debug AI-written code if their skill formation was inhibited by using AI in the first place.

Che imho dice una cosa interessante. In sintesi, gli unici che dimostrane un reale incremento di produttivita’ sono quelli che fanno pure “vibe coding”

There is a group of participants who relied on AI to generate all the code and never asked conceptual questions or for explanations. This group finished much faster than the control group (19.5 minutes vs 23 minutes), but this group only accounted for around 20% of the participants in the treatment group.

Che poi son quei casi in cui ti trovi API tokens, secrets, salcazzo, esposti in chiaro nel repo o peggio, direttamente esposti nel browser quando qualcuno accede al tuo servizio online.

Other participants in the AI group who asked a large number of queries (e.g., 15 queries), spent a long time composing queries (e.g., 10 minutes), or asked for follow-up explanations, raised the average task completion time.

Io rientro in questo tipo per dire. Ma va detto che effettivamente un guadagno ci sta comunque. Non ho granche’ voglia ormai, dopo 20+ anni, di scrivere il solito codice cinquanta volte. Sapendo dare direzioni e cosa controllare quando mi produce roba, mi risparmia il tedio e il tunnel carpale di farlo io.

Non se ne parla neanche quando son forzato a usare uno stack che non uso di solito, come in un progetto recente in cui ho dovuto usare per forza bicep e powershell (uso terraform e bash / python di solito). Di mettermi a imparare quello stack non solo non ho intenzione ma non c’era proprio tempo per deadlines assurde, in quel caso, magari il codice di per se’ non era il migliore, ma principi base KISS e DRY son stati rispettati e ugualmente una struttura modulare decente dell’intero framework che ho dovuto generare perche’ comunque l’esperienza ce l’ho.

Il rischio vero e’ per i “nuovi” che non hanno questa esperienza maturata e vengono buttati dentro con la minaccia “usa l’ai o resti indietro” e con restare indietro vuol dire “ti passano altri avanti e quella e’ la porta”.

Together, our results suggest that the aggressive incorporation of AI into the workplace can have negative impacts on the professional development workers if they do not remain cognitatively engaged. Given time constraints and organizational pressures, junior developers or other professionals may rely on AI to complete tasks as fast as possible at the cost of real skill development.

1 Like

edit

io ormai son dentro a questa fetta :asd:

per chi è già senior e ha già nuotato in merda fumante per tanto tempo il vibe coding è un grossissimo strumento e se hai la voglia di esplorare e comprendere meglio il prompt engineering la produttività schizza alle stelle (o meglio fai più robe ma nello stesso tempo hai più tempo libero da usare per star sul forum mentre l’agent fa cose :asd:)

però comprendo bene i rischi, io stesso mi rendo conto che su alcune cose sto un po’ perdendo la skill puramente tecnica ed estremamente specializzata, ma nel contempo riesco a fare cose che non avrei mai avuto il tempo di fare.

Il vantaggio di chi è senior è che ha la capacità di capire se l’output è una merda e sa come correggere/prevenire e hanno soprattutto la voglia di star li anche una giornata semplicemente a stilare con l’agent un documento di specifiche preciso, che permette di avere poi un output non dico perfetto al primo colpo ma comunque giusto al 90%.

Mi spiace un po’ per gli junior che faranno più fatica a comprendere veramente cosa sta succedendo

3 Likes

Da persona che non ne sa un cazzo, considerato che l’ottimizzazione del codice non è che di base fosse un caposaldo dell’informatica degli ultimi anni, prevedo un futuro assolutamente roseo :sisi:

1 Like

Ogni aumento di competenza negli esseri umani passa tramite il realizzare errori chiari e comprensibili.

L’AI quando funziona non ti fa commettere errori, e quando non funziona te ne fa commettere di tipo confuso, da cui non ricavi lezioni.

In other news, l’acqua è bagnata.

2 Likes

Però i layoff a favore dei junior li hanno sempre fatti costano di meno, si vede che manco è richiesta tutta questa skill in certi progetti.

Sì, credo dipenda da quanto i prodotti possano essere usa e getta.

Per il software tipo Temu, il vibe coding va benissimo.

Infatti si torna al discorso management composto gente con chiare problematiche sociali o incompetenti visto che, at first:

But then:

Magari, forse eh, e’ un po’ una grandissima stronzata quella che hai scritto. Se poi era in sarcasmo, mi scuso.

related

https://xcancel.com/gothburz/status/1999124665801880032

1 Like

Comunque mentre Anthropic posta questo, Dario Amodei fa le sue annusate di peti dove parla del grandeur dell’umanità computer assistita con Adolescence of Technology.

edit che mi rendo conto di esser stato poco chiaro - ha scritto un altro testo dove è marcatamente ottimista, questo è quel che per me è un suo tentativo di esser pessimista.

si l’ai nel coding sta scavando una trincea tra i junior e i senior.

da un lato i junior che non impareranno mai

dall’altro mrdoob (creatore di three.js) che con claude porta quake su js in un weekend

1 Like

Era una constatazione di come ha operato l’industria in passato, la borsa fa notoriamente gli elicotteri col cazzo sui layoff e l’industria nel proporre innovazioni dagli IDE Visuali, RAD, Framework, low/no-code ecc. ha sempre cercato di fare fuori gente che gli costava di più a favore di chi gli costava meno, ed anche abbassare l’asticella delle skill necessarie.

La conseguente crescita economica di un settore in espansione ha comunque riallocato gente, che intanto si è reskillata/reinventata e/o si è messa in proprio.

Su MS loro hanno sempre fatto cacare WinXP al lancio faceva cacare con Dave Cutler alle spalle che ancora ne bestemmia a riguardo al podcast Dave’s Garage :asd: