ALT text detailsStill susceptible to prompt injection #
From the safety section of Anthropic’s announcement post:
With Opus 4.5, we’ve made substantial progress in robustness against prompt injection attacks, which smuggle in deceptive instructions to fool the model into harmful behavior. Opus 4.5 is harder to trick with prompt injection than any other frontier model in the industry:
Bar chart titled "Susceptibility to prompt-injection style attacks"
On the one hand this looks great, it’s a clear improvement over previous models and the competition.
What does the chart actually tell us though? It tells us that single attempts at prompt injection still work 1/20 times, and if an attacker can try ten different attacks that success rate goes up to 1/3!
I still don’t think training models not to fall for prompt injection is the way forward here. We continue to need to design our applications
참의원 선거 약진한 극우정당, 여성 당원이 왜 많을까? https://www.ildaro.com/10319 "이처럼 정책의 중심에 성차별적 사상을 담으면서도, 여성당원을 전면에 드러내는 역설적인 전략은 지금 유럽 극우정당의 트렌드이기도 하다." "이러한 모순을 설명하는 개념이 ‘페모내셔널리즘’(Femonationalism)이다. 이 개념은 여성의 권리와 안전을 지키겠다는 목적이, 이민자 배척이나 공권력(치안) 강화를 정당화하는 내셔널리즘(국가주의, 애국주의, 배외주의, 인종주의)에 이용되는 것을 가리킨다. 이민자 남성에 의한 성범죄는 크게 부각되고 규탄을 받는 반면, 자국 남성에 의한 성차별과 폭력은 경시되는 구조가 전형적이다."
‘엡스틴 파일’ 공개된다…하원 반대 1표뿐, 상원은 만장일치
www.hani.co.kr/arti/interna...
"앞서 트럼프 대통령은 법안 상정을 막기 위해 이를 추진 중이던 3명의 공화당 여성 의원에게 직접 전화를 걸고, 백악관 참모진을 동원해 위협성 경고까지 보냈다. 백악관은 ‘법무부 전체 자료 강제 공개 법안’을 본회의에 상정하는 청원서를 지지하는 것을 “행정부에 대한 적대 행위”로 간주하겠다고 경고하기도 했다. 뉴욕타임스는 “이러한 압박 작전은 오히려 역효과를 낳았다”고 전했다."
I try to be polite when I write prompts for LLMs. Especially in languages like Korean or Japanese that have grammatical honorifics, I make sure to use the formal, respectful form of speech (what's known as 敬語—gyeongeo or keigo). I joke with my friends that I'm using polite language early on to be pardoned for my sins when AI eventually takes over the world, but the real reason is that I don't want to get used to speaking to someone in a commanding tone. It makes me think I might start believing it's “okay” to order around certain intelligent beings, almost like condoning slavery.
#Hollo 0.7 brings a redesigned #notification system with much better performance. We've moved from generating #notifications on-demand to storing them as they happen, which makes the notifications endpoint about 60% faster. We've also added response compression (though if you're using a reverse proxy, you probably had this already).
More notably, Hollo 0.7 implements Mastodon's v2 grouped notifications API. Notifications like favorites, follows, and reblogs targeting the same post or account are now grouped together server-side, reducing clutter. Clients that support the new API (introduced in #Mastodon 4.3) will show cleaner, more organized notifications automatically.
Hollo 0.7 is still in development, but we're excited to share it with you when it's ready!
와 미쳤다 ;;; 코멧 브라우저로 같은 글을 여러번 열어 각각에 오타 수정시키고, 글 내용 검증시키고, 글에 인용한 수식과 표현의 정합성을 점검해 수정시키는 작업을 동시에 진행시키면 컨플루언스가 이들 사이의 작업을 알아서 동기화하고 있다. ... 사실 에이전트 각각의 동작은 내가 직접 하는것보다 압도적으로 느림. 하지만 이 작업들을 동시에 수행하면 그 느림을 완화할 수 있음.
Meet the new Site Control Centre in Zen. A single menu for the page you’re on. Take a screenshot, bookmark a site, open extensions, or check site permissions; all without digging through settings.
A copy link button and a sidebar toggle in the URL bar are also included in this update.
문제 해결을 위해 여러 가지 임베딩 모델을 테스트해보다가 구글의 임 베딩 모델은 작업 유형을 선택할 수 있다는 걸 알게 되었습니다. 임베딩 모델을 호출할 때 문서의 경우 [task_Uype: RETRIEVAL_DOCUMENT, 쿼리 의 경우 task_ype: RETRIEVAL_QUBRY과 같은 형태로 옵션을 넘겨 해당 작업에 최적화된 형태로 임베딩을 만들어냈습니다.
위 옵션을 지정하고 다른 임베딩 모델들과 비교하자 훨씬 좋은 결과를 얻었습니다.