DuckDBの人気記事 118件 - はてなブックマーク

検索対象

並び順

人気

ブックマーク数

期間指定

1週間
1年

1 - 40 件 / 118件

人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

DuckDBの検索結果1 - 40 件 / 118件

DuckDBに関するエントリは118件あります。 duckdb、 DB、 db などが関連タグです。人気エントリには『オレオレ RAG をさくっと作る』などがあります。

DuckDBの関連エントリー

DuckDB-Wasm, MapLibre GL JS, CloudFlare Pagesを使って、オープンデータを可視化してみたときの学び
DuckDB-Wasm, MapLibre GL JS, CloudFlare Pagesを使って、オープンデータを可視化してみたときの学び
18 users
DuckDBにMVTが来た!フロントで完結するベクトルタイル配信
DuckDBにMVTが来た!フロントで完結するベクトルタイル配信
16 users
DuckDB-spatial の対抗馬!? SedonaDB 最速入門
DuckDB-spatial の対抗馬!? SedonaDB 最速入門
16 users
Announcing DuckDB 1.4.0 LTS
Announcing DuckDB 1.4.0 LTS
13 users
Announcing Pg_duckdb Version 1.0 - MotherDuck Blog
Announcing Pg_duckdb Version 1.0 - MotherDuck Blog
20 users
『DuckDB実践入門』が出版されます
『DuckDB実践入門』が出版されます
45 users
Basic Feature Engineering with DuckDB
Basic Feature Engineering with DuckDB
27 users
DuckDB + Claude Desktop + MCP で X(Twitter)のアーカイブデータを閲覧する
DuckDB + Claude Desktop + MCP で X(Twitter)のアーカイブデータを閲覧する
29 users
CLI ツールに DuckDB を組み込んで HTTP リバプロを使いブラウザで見られる UI ページを作る
CLI ツールに DuckDB を組み込んで HTTP リバプロを使いブラウザで見られる UI ページを作る
37 users
DuckDBでR2 Data Catalog & DuckLakeを試す(with Neon)
DuckDBでR2 Data Catalog & DuckLakeを試す(with Neon)
25 users

オレオレ RAG をさくっと作る
- 341 users
- voluntas.ghost.io
- テクノロジー
- 2025年04月18日
この記事は間違いが含まれている可能性があります。もともと自社のドキュメントでは Meilisearch で日本語全文検索を実現していましたが、ドキュメントに質問できるようしたいと思い、簡単な RAG を作りたい!と思っていました。とりあえず、ドキュメントを分割し、ベクトル化してベクトルデータベースに突っ込んで、質問をベクトル化して結果を引っ張り、それを LLM に食べさせて解説させる、というのができればよいということがわかりました。ベクトル化はよく使われている OpenAI Embeddings API を利用し、ベクトルデータベースは普段からよく使っている DuckDB に VSS (Vector Similarity Search for DuckDB) という拡張を使うことにしました。自社のドキュメントをなんとかうまいこと分割して、あとは分割したドキュメントを API を叩い
- RAG
- AI
- LLM
- あとで読む
- duckdb
- 自然言語処理
- MCP
- プログラミング
- db
オレオレ RAG をさくっと作る
新しいデータ処理ライブラリの学習はもう不要! Python 初学者のための Ibis 100 本ノック - Qiita
- 257 users
- qiita.com/kunishou
- テクノロジー
- 2024年01月08日
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Information 2024年7月24日: Ibis-Polars vs Native Polars Ibis-Polars と Native Polars の処理速度の比較記事を書かれている方がおりました。 Ibis 経由で Polars を使用しても Polars と処理速度に大きな差がないことを示していました。 ibis-frameworkでPolarsとSQLをつかってみた 2024年1月14日: Kaggle notebook for Ibis Kaggle で Ibis を使用するための Sample Notebook を用
- python
- あとで読む
- Ibis
- ライブラリ
- pandas
- polars
- データ分析
- データ処理
- qiita
- 学習
新しいデータ処理ライブラリの学習はもう不要! Python 初学者のための Ibis 100 本ノック - Qiita
S3にあるALBログの調査はAthenaよりDuckDBのほうが簡単 - road288の日記
- 247 users
- road288.hatenablog.com
- テクノロジー
- 2024年11月06日
AWSのALB(Application Load Balancer)のログはS3に置かれるが、この中身をサクッと調べたいとき、Athenaを使う方法が標準的で、下記で案内されているようにパーティション射影(Partition Projection)でテーブルを作ってAthenaからクエリする。パーティション射影を使用して Athena で ALB アクセスログ用テーブルを作成する - Amazon Athena 私も従来はその方法を使っていたが、Athenaはブラウザから使うと動作がもっさりしているし、決まったクエリを1回きり実行して結果を取得したいだけのときならまだしも、探索的にクエリを何発も実行したいときには使い勝手が悪い。最近他のプロジェクトでDuckDBを使うようになって、使い勝手の良さに感動していたが、DuckDBはALBのログを探索的に調べたいときにもめっちゃ使えると思った
- aws
- DuckDB
- あとで読む
- db
- ログ
- ALB
- s3
- log
- Athena
- logging
S3にあるALBログの調査はAthenaよりDuckDBのほうが簡単 - road288の日記
素人が参院議員の議案賛否検索サイトを作ってみた
- 219 users
- zenn.dev/midorisawa07
- テクノロジー
- 2025年07月19日
参議院議員がこの6年間の議案に対し、どのような投票をしたのかが分かるサイトを作りました。 WEBに関しては点で素人ですが、以下で紹介するDBやツールに頼って1週間で取り敢えず形にしてみました。投票日直前の公開になってしまいました。もう少し早く取り掛かって早く公開できれば良かったですね。ごめんなさい。背景ボートマッチの問題点として「未来のことはいくらでも言える」という構造的な限界があります。実現する気のない公約が含まれている可能性もあり、実際に守られるかどうかも不透明です。一方、過去の行動は隠せません。とりわけ現職議員においては、「これまでの議案にどのように投票したか」を見ることで、主張と行動の整合性を判断できます。 (「議案」とは、法律、予算、条約承認、人事、決議などの国会で話し合う案件のことです。) 参議院のWebサイトでは、過去の議案の投票結果を見ることができます。議員がそ
- webサービス
- あとで読む
- 政治
- データ
- AI
- 開発
- search
- 法律
素人が参院議員の議案賛否検索サイトを作ってみた

DuckDBの関連エントリー

Claude Codeの会話ログをDuckDBで分析して自分の仕事スタイルを改善する方法 - yasuhisa's blog
- 214 users
- www.yasuhisay.info
- テクノロジー
- 2025年06月15日
3行まとめはじめに Claude Codeのログ保存機能とその特徴ログ分析の活用例音声入力の課題と英語プロンプトの活用 DuckDBを用いた分析アプローチスキーマ情報の重要性とログ分析の活用ログの長期保存設定まとめ 3行まとめ Claude Codeの会話ログはJSONL形式で保存されており、DuckDBを使って日次の利用状況や音声入力の課題などを分析できる英語プロンプトの学習効率化やエラーパターンの特定など、自分の仕事の仕方を改善するための実践的な活用方法がある JSONLファイルのスキーマ情報を整理することで、Claude Codeがクエリを書く際の精度が向上するはじめに Claude Codeは非常に強力なツールで、これ自体は別のブログで書く予定ですが、もはやこれなしでコードを書けないほど便利に使っています。今回は、そのClaude Codeとの会話ログを分析すること
- ai
- あとで読む
- duckdb
- Claude Code
- ログ
- programming
- 分析
- claude
- ツール
- JSON
Claude Codeの会話ログをDuckDBで分析して自分の仕事スタイルを改善する方法 - yasuhisa's blog
なぜ DuckDB を採用したのか
- 209 users
- zenn.dev/shiguredo
- テクノロジー
- 2024年11月17日
概要なぜ自社で DuckDB を採用したのかを、雑に書いていきます。変更履歴 2025年03月12日: DuckDB の開発体制と Zstandard で圧縮されたファイルの読み込みについて追記 2025年02月13日: 今後やりたい事 v2 を追記まとめ DuckDB / DuckDB-Wasm を利用する事で中小規模のサービスであれば、ログ解析や統計情報の可視化を低コストで提供することができる DuckDB を go-duckdb 経由で利用する事で、HTTP リクエスト単位での DuckDB を利用できる DuckDB-Wasm と OPFS を利用する事で、クライアント側での統計情報のため込みができるようになる解決したい課題解決したい課題は基本的にサービスの運用費を抑えるということです。中小規模のサービスでは運用費が大きな課題になります。自社パッケージ向けのログ解析ツー
- duckdb
- あとで読む
- wasm
- DB
- SQL
- ツール
- WebAssembly
- ログ
- database
なぜ DuckDB を採用したのか
製品ドキュメントは読むのではなく質問する時代
- 196 users
- voluntas.ghost.io
- テクノロジー
- 2025年04月09日
VS Code の GitHub Copilot が MCP クライアントとして動作する仕組みが追加されたので、Copilot から気軽に自社製品の質問ができたら、快適ではないだろうか?考えた。そこで、ハルシネーションをできるだけ少なくし、かつ安価で自社製品ドキュメントへの質問ができる仕組みを作ってみることにした。ちなみに LLM 系の知識はほぼ無い。できあがった Sora Document MCP (Local) 0:00 /0:57 ×ばつ GitHub Copilot + Sora Document MCP デモまぁまぁの速度で、質の高い回答を箇条書きで返してくれるようにはなった。仕組みについて自社製品のドキュメントは Sphinx というフレームワークをを利用しており、reStucturedText (以降 rst) というマニアックなもので書かれている。この rst を L
- AI
- MCP
- あとで読む
- RAG
- ドキュメント
- document
- データベース
- LLM
- コード
- API
製品ドキュメントは読むのではなく質問する時代
DuckDB で日本語全文検索
- 181 users
- voluntas.ghost.io
- テクノロジー
- 2025年04月26日
DuckDB-VSS と PLaMo-Embedding-1B を利用することで、ベクトル検索を実現できますが、DuckDB-FTS (Full-Text Search) と形態素解析ライブラリである Lindera を組み合わせて日本語全文検索を実現できます。 DuckDB-FTS + LinderaDuckDB の全文検索拡張は日本語には対応していないないのですが、スペース区切りでトークン化することで、日本語の全文検索を利用する事が出来ます。トークン化には Meilisearch にも利用されている信頼と安心の Lindera を利用することにしました。今回この参考コードを Lindera の作者であり検索の専門家でもある Minoru OSUKA 氏にレビューいただきました。本当にありがとうございます。以下は参考コードです。 [project] name = "duckdb-ft
- DuckDB
- あとで読む
- 全文検索
- DB
- 検索
- search
- 日本語
- techfeed
- Python
DuckDB で日本語全文検索
The DuckDB Local UI
- 164 users
- duckdb.org
- テクノロジー
- 2025年03月12日
TL;DR: The DuckDB team and MotherDuck are excited to announce the release of a local UI for DuckDB shipped as part of the ui extension. The DuckDB project was built to make it simple to leverage modern database technology. DuckDB can be used from many popular languages and runs on a wide variety of platforms. The included Command Line Interface (CLI) provides a convenient way to interactively run
- DuckDB
- あとで読む
- ui
- database
- DB
- 開発
- SQL
- tech
- 仕事
The DuckDB Local UI
5分でわかるDuckDB
- 154 users
- speakerdeck.com/chanyou0311
- テクノロジー
- 2024年12月15日
「合同勉強会 in 大都会岡山 -2024 Winter-」の発表資料です。 https://gbdaitokai.connpass.com/event/330065/
- duckdb
- あとで読む
- DB
- データベース
- 資料
- database
- 学習
- 勉強
- *あとで読む
5分でわかるDuckDB
ブラウザで動作する地理空間データ処理ライブラリとして DuckDB-wasm を使い、 SQL を TypeScript で管理する仕組みを作る - newmo 技術ブログ
- 152 users
- tech.newmo.me
- テクノロジー
- 2024年11月15日
newmo では、地図データや地理情報を扱う場面が多くあります。たとえば、タクシーやライドシェアでは、営業区域のような営業していいエリアといった地理的な定義があります。また、乗り入れ禁止区域のようなタクシーが乗り入れてはいけないエリアといった定義も必要になります。これらの地理に関する定義は GeoJSON のような地理情報を扱うデータ形式で管理されることが多いです。しかし、GeoJSONなどの定義をテキストとして手書きするのは困難です。そのため、地図上に区域を作図するエディタやその定義した区域が正しいかをチェックするような管理ツールが必要です。管理ツールは、ウェブアプリケーションとして作った方が利用できる環境が広がります。このような地理情報は一度に扱うデータが多かったり、空間的な計算処理が必要になるため、専用の仕組みを使うことが多いです。このような技術を、地理情報システム(
- DuckDB
- TypeScript
- あとで読む
- gis
- WebAssembly
- SQL
- wasm
- データ
- 地図
ブラウザで動作する地理空間データ処理ライブラリとして DuckDB-wasm を使い、 SQL を TypeScript で管理する仕組みを作る - newmo 技術ブログ
DuckDBを使ったシンプルで安価なデータマネジメント
- 145 users
- speakerdeck.com/chokkoyamada
- テクノロジー
- 2024年12月10日
要件  - 時系列のIoTデータ  - スキーマは単一でなく、たくさんある(Heartbeat, 位置情報, 姿勢, GNSS(衛星)情報, バッテリー, etc...) - ニアリアルタイムで保存し、数秒以内にはフロントエンドのウェブアプリからクエリできる状態にする  - 前後のレコードを比較して監視・検知してSlackにアラートを飛ばす  - 過去データもフロントエンドのウェブアプリからクエリできる状態を保つ  - アドホックな分析クエリも投げることがある(頻繁ではない)  - ファイルベースのログとかRDBとも接続してJOINして分析したい  - エンジニアは一人(サーバーサイド全般+データ系をまるっと担当)
- duckdb
- あとで読む
- db
- slide
- aws
DuckDBを使ったシンプルで安価なデータマネジメント
DuckDB を用いて日々のストック記事をハイブリッド検索する
- 127 users
- www.yukioh.net
- テクノロジー
- 2025年04月30日
Toggle dark mode DuckDB を用いて日々のストック記事をハイブリッド検索する Apr 30, 2025 今回は、DuckDB を使って、日々ストックしている Web 記事などのハイブリッド検索(全文検索とベクトル類似度検索の組み合わせ)を実現する試みについてまとめます。モチベーション自分は普段、情報収集や後で読みたい記事の保存に Readwise Reader というサービスを利用しています。RSS フィードの購読や記事のアーカイブができ、非常に便利なツールです [1] 。この Readwise Reader にも検索機能(全文検索)はあるのですが、どこか微妙さを感じていました。特に日本語の記事を探す際に意図した記事が見つからないことが多々あり、不満ポイントでした (海外サービスあるある)。そんな矢先、時雨堂さんの「DuckDB でハイブリッド検索」の記事を拝
- DuckDB
- あとで読む
- search
- markdown
- 検索
- db
- html
- article
DuckDB を用いて日々のストック記事をハイブリッド検索する
Big Data is Dead - MotherDuck Blog
- 124 users
- motherduck.com
- テクノロジー
- 2023年02月08日
For more than a decade now, the fact that people have a hard time gaining actionable insights from their data has been blamed on its size. "Your data is too big for your puny systems," was the diagnosis, and the cure was to buy some new fancy technology that can handle massive scale. Of course, after the Big Data task force purchased all new tooling and migrated from Legacy systems, people found t
Big Data is Dead - MotherDuck Blog
スケールアウトはもう要らない?DuckDBが描くシステム設計の新時代 🦆 - Qiita
- 124 users
- qiita.com/ogi-iii
- テクノロジー
- 2025年02月23日
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 目的本稿では、DuckDBがもたらす新しいシステム設計の可能性を探ります。特に、2024年時点で主流な「スケールアウト」モデルを前提としたデータ処理システムから、よりシンプルで効率的な「スケールアップ」モデルが将来的に主流となり得る理由を説明します。また、DuckDBの技術的特性、注目されている理由、具体的なその用途についても詳しく解説します。対象読者ソフトウェアアーキテクト:システム設計や運用コストの最適化を検討している人データエンジニア:アプリケーションデータやログデータなどの様々なデータセットを効率的に処理したい人システ
スケールアウトはもう要らない?DuckDBが描くシステム設計の新時代 🦆 - Qiita
ブラウザでオフライン日本語インスタント全文検索を実現する
- 113 users
- voluntas.ghost.io
- テクノロジー
- 2025年04月29日
DuckDB の FTS (Full Text Search) 拡張と Lindera を利用する事で、日本語全文検索を実現できますが、DuckDB-Wasm と Lindera-Wasm を利用する事でブラウザで日本語全文検索を実現できます。Wasm なので完全オフラインで、利用できます。さらに、クライアントのリソースということもあり一文字ずつ入力された値に対して Lindera-Wasm で形態素解析して、SQL を実行することでインスタント検索も実現できます。 DuckDB-Wasm (FTS 拡張) + Lindera-Wasm技術的には特に難しいことはしておらず、DuckDB-Wasm の FTS 拡張に Lindera-Wasm で形態素解析した結果を引数として渡して実行しているだけです。デモサイトを用意しておきました、もし良ければ試してみてください。 DuckDB-Wa
- duckdb
- wasm
- あとで読む
- search
- WebAssembly
- SQL
- db
- 検索
- techfeed
ブラウザでオフライン日本語インスタント全文検索を実現する
DuckDB で JSON Lines 形式のログを精査する
- 100 users
- zenn.dev/shiguredo
- テクノロジー
- 2024年10月15日
まとめ圧縮された複数の JSON Lines を読み込める S3 から直接読み込める好きなタイミングで Parquet で出力 DuckDB とはこちらをどうぞ。 DuckDB雑紹介(1.1対応版)@DuckDB座談会 - Speaker Deck 圧縮済みのログを読み込む解析対象のログファイルって spam-20240501.jsonl.gz や egg-20240601.jsonl.zst みたいに圧縮されていたりします。特に日付単位で分かれてたりすることは多いです。そこから目的のログを探し出すのは、基本はスクリプトを書くことが多いと思います。 DuckDB を使えば色々解決します。
- DuckDB
- JSON
- あとで読む
- db
- database
DuckDB で JSON Lines 形式のログを精査する
AWS Athenaの安価な代替手段:Lambda x DuckDB - Qiita
- 99 users
- qiita.com/shinonome_taku
- テクノロジー
- 2023年03月24日
Athena Amazon Athenaは、標準SQLを使用してAmazon S3に保存されたデータを分析することができる、強力でサーバーレス、インタラクティブなクエリサービスです。複雑なETLパイプラインやデータウェアハウスを設定して管理する必要がなく、大量のデータを処理する組織にとって魅力的なオプションです。ただし、Athenaの価格設定は、予算が厳しい場合など、すべてのユーザーに適しているわけではありません。このブログ投稿では、Athenaの代替となる、低コストで同等の機能を提供できるアルティメットを紹介します。利点: Athenaの主な利点の1つは、Amazon S3のデータを、複雑なETLプロセスや専用のデータウェアハウスなしに、標準SQLクエリを使用して分析できることです。 Athenaはサーバーレスでもあり、データ量やクエリの複雑さに基づいて自動的にスケールされるため、事前
- aws
- あとで読む
- lambda
- athena
- db
AWS Athenaの安価な代替手段:Lambda x DuckDB - Qiita
DuckDB-Wasm + 生成AI on Next.js で、どなたでも、いますぐ、地理空間情報の分析ができましてよ
- 96 users
- zenn.dev/yuiseki
- テクノロジー
- 2024年10月24日
本日のデモ本日のソースコードタイトルには、文字数の限界で、DuckDB-Spatialという言葉を入れられなかったですわ。もちろん、今回も、DuckDB-Wasmに加えて、DuckDB-Spatialも活用していますわよ。はじめにわたくしは、学術的研究として、生成AIによるSQLクエリ生成、そして、生成AIによる地理空間情報の分析と可視化、といった事例が既に多数あることは知っていますわ。しかしながら、いったい、どれだけの研究者が、そうした研究を、実際にどなたでもが触ることのできるWebアプリケーションやスマートフォンアプリケーションなどのソフトウェアプロダクトとしてデプロイして、本気で世界を変えたいという情熱を持っているのでしょうかしら? わたくしは、どのようなアイデアも、ソフトウェアプロダクトとして、どなたでも試せるようにデプロイしてこそ、ようやく世界を変える第一歩目だと考え
- AI
- あとで読む
- WebAssembly
- next.js
- wasm
- React
- 人工知能
- techfeed
- ソフトウェア
DuckDB-Wasm + 生成AI on Next.js で、どなたでも、いますぐ、地理空間情報の分析ができましてよ
オープンソースの S3 互換オブジェクトストレージ MinIO を DuckDB で使う
- 96 users
- zenn.dev/shiguredo
- テクノロジー
- 2024年11月07日
前提 DuckDB が使える環境 Docker Compose が使える環境まとめ DuckDB から S3 互換オブジェクトストレージを利用する際、MinIO を使う事で、ローカルに気軽に S3 互換オブジェクトストレージ環境を用意できる。 DuckDB とはこちらをどうぞ。 DuckDB雑紹介(1.1対応版)@DuckDB座談会 - Speaker Deck MinIO とは MinIO はオープンソースの S3 互換オブジェクトストレージです。 DuckDB は S3 API 機能を持っており、S3 互換オブジェクトストレージとの相性がとても良いです。ローカルで試したい時などに Docker Compose で MinIO を用意して利用すると、とても便利です。 Docker Compose ローカルということでセキュリティは一切考慮していません MinIO のイメージを pu
- DuckDB
- あとで読む
- ストレージ
- tech
- web
- まとめ
オープンソースの S3 互換オブジェクトストレージ MinIO を DuckDB で使う
Claude Codeの使用料金を可視化するCLIツール「ccusage」を作った
- 92 users
- zenn.dev/ryoppippi
- テクノロジー
- 2025年05月30日
追記(2025年07月18日) 多くの方にみていただきありがとうございます!! この記事のものと実際の実装はすでに少し異なっているので以下の記事も併せてご覧ください。そしてccusageの解説動画もあります!併せてご覧くださいはじめにみなさん、Claude Code使ってますか?私は毎日使っています。 Vibe Codingガチアンチだったのですが、Claude Code + Sonnet 4の組み合わせがあまりにも強力すぎて、今では手放せません。ところで Claude Max プラン、最高ですよね。月額100ドルで使い放題。でも、ふと思いませんか? 「これ、従量課金だったらいくらかかってたんだろう...?」そんな疑問を解決し、「Maxプランでこんなに得してる!」とニヤニヤするためのCLIツール「ccusage」を作りました。きっかけこのツールを作るきっかけになったのは、@mi
- claude
- Anthropic
- AI
- datavisualization
- CLI
- あとで読む
- claude code
- claudeCode
- 課金
Claude Codeの使用料金を可視化するCLIツール「ccusage」を作った
データエンジニアリング領域におけるDuckDBのユースケース
- 90 users
- speakerdeck.com/chanyou0311
- テクノロジー
- 2025年02月27日
「DuckDBの魅力解剖!〜現場から見る活用術とその可能性〜」の登壇資料です。 https://findy.connpass.com/event/343059/
- duckdb
- あとで読む
- DB
- article
データエンジニアリング領域におけるDuckDBのユースケース
DuckDB-Wasm + DuckDB-Spatial = Webブラウザ上で完結する地理空間情報分析
- 86 users
- zenn.dev/yuiseki
- テクノロジー
- 2024年10月13日
本日のデモ: 本日のソースコード: おっと、待たせたねぇ!今日は「DuckDB-Wasm」と「DuckDB-Spatial」についてご案内いたしやすよ! この記事を読めば、ブラウザだけで地理空間情報の分析をサクッとこなせすための環境構築や、便利な関数を使った地理空間情報分析の基本がバッチリわかるって寸法よ!これを知っときゃ、サーバーいらずで本格的な地理空間情報分析ができちまうし、つまずきやすいポイントもスッキリ解消!あんたもいますぐ地理空間情報分析の達人になれるこたぁ間違いなしだ!さぁ、江戸っ子の心意気で、いますぐその手で試してみな! Vite.js + React でやんでぇ!まず、Vite.js + React + TypeScriptを開発環境の基板とするってのは、問答無用で決まりだ!ほかにゃ選択肢はねぇってわけよ。Viteの速さ、Reactの使いやすさと豊富なライブラリのエコシステ
DuckDB-Wasm + DuckDB-Spatial = Webブラウザ上で完結する地理空間情報分析
🦆🦆🦆🦆🦆🦆DuckDB入門🦆🦆🦆🦆🦆🦆
- 84 users
- zenn.dev/notrogue
- テクノロジー
- 2022年09月24日
tl;dr SQLiteのOLAP版だよ OLAP系のクエリにおいて、PandasやSQLiteより早いらしいよ CSV・Parquet・Pandas DataFrameの読み書きできて便利だよ背景ポジション・競合一言で言うとSQLiteのOLAP版です。位置づけとしては、論文(DuckDB: an Embeddable Analytical Database (SIGMOD 2019 Demo))記載のSystem Landscapeがわかりやすいです。 (DuckDB: an Embeddable Analytical Database (SIGMOD 2019 Demo)より) このLandscapeでは、データベースを Standalone(クライアント・サーバモデル)か、組み込み(シングルマシン・インプロセス)か OLTPかOLAPかの二軸に分割しています。その上で、ク
- SQLite
- db
- duckdb
- OLAP
- データベース
- comparison
- あとで読む
🦆🦆🦆🦆🦆🦆DuckDB入門🦆🦆🦆🦆🦆🦆
DuckDB雑紹介(1.1対応版)@DuckDB座談会
- 82 users
- speakerdeck.com/ktz
- テクノロジー
- 2024年09月13日
2024年6月に発表した(https://speakerdeck.com/ktz/duckdbza-shao-jie)内容にDuckDB バージョン1.1の変更点を追記した版
- DuckDB
- あとで読む
- SQL
- DB
- database
- プログラミング
- programming
DuckDB雑紹介(1.1対応版)@DuckDB座談会
DuckDB でハイブリッド検索
- 73 users
- voluntas.ghost.io
- テクノロジー
- 2025年04月26日
DuckDB を利用してベクトル検索と日本語全文検索の両方を同時に利用できます。さらにこれらの結果をマージして Reranking を行うことでハイブリッド検索をサクサクっと実現する事ができます。 Rerankerどうやらベクトル検索した結果と日本語全文検索した結果をマージして、クエリーとマージ結果を再度ランキング付けする仕組みのようです。ここでは参考にした記事を共有する程度にしておきます。日本語最高性能のRerankerをリリース / そもそも Reranker とは? - A Day in the Lifeリランキングモデルによる RAG の日本語検索精度の向上 - NVIDIA 技術ブログ今回は Reranker に hotchpotch/japanese-reranker-cross-encoder-large-v1 を利用しました。以下は参考コードです。 [projec
- DuckDB
- あとで読む
- db
- search
- 検索
- Python
DuckDB でハイブリッド検索
DuckDB雑紹介
- 68 users
- speakerdeck.com/ktz
- テクノロジー
- 2024年08月28日
DuckDBを触っていて特に興味を持った機能を中心に雑解説します。
- DuckDB
- DB
- あとで読む
- データベース
- database
- data
DuckDB雑紹介
DuckDBでお手軽!データフェデレーション - Techtouch Developers Blog
- 67 users
- tech.techtouch.jp
- テクノロジー
- 2024年05月20日
tl;dr はじめに DuckDB とは DuckDB では何が読めるのか使ってみる S3 上のJSON を読んでみるリレーショナルデータベース他ツールではなく DuckDB を使うメリットしくじりポイント (特にリリースされたばかりの)バージョンには気をつける S3 のオブジェクト数が多い場合不都合がありがちスレッドの調整が必要な場合も Redshift には未対応終わりに付録 MySQL のデータを読み込む例の MySQL 側の準備 tl;dr DuckDB 便利だよ。分析以外でも使えるよ色々な場所のデータを閲覧・結合できるよ。標準SQLも使えるよただし、細かい落とし穴は色々あるので気をつけてねはじめに2023年4月にデータエンジニアとして入社したmin(@not_rogue)です。暖かくなるにつれ、YouTube で見た南伊豆ロングトレイル | 松崎町に行く機運が
- duckdb
- DB
- MySQL
- あとで読む
- database
DuckDBでお手軽!データフェデレーション - Techtouch Developers Blog
SQL+Markdownだけでデータ可視化できるOSS Evidenceを使ってPerfumeの楽曲分析をしてみる - Qiita
- 66 users
- qiita.com/yam_dr
- テクノロジー
- 2024年10月29日
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? BIをコード管理したくないですか?私はしたいです。 BI as Codeを謳うOSSがあるようなので、Get Startedしてみます。環境構築公式ドキュメントを見ると、VSCodeのExtensionを入れて開発することを推奨しているようです。 2.Open the Command Palette (Ctrl/Cmd + Shift + P) and enter Evidence: New Evidence Project 3.Click Start Evidence in the bottom status bar 拡張機能のイ
- sql
- BI
- dashboard
- markdown
- visualization
- あとで読む
SQL+Markdownだけでデータ可視化できるOSS Evidenceを使ってPerfumeの楽曲分析をしてみる - Qiita
DuckDB メモ v1
- 63 users
- zenn.dev/voluntas
- テクノロジー
- 2024年02月04日
色々古くなったので 1 から書き直した DuckDB メモ v2 モチベーション JSONL を読み込んで解析するツールが欲しかったログを読み込ませたいので圧縮機能は必須自社のパッケージ製品が出力する JSONL を読み込んで解析できる仕組み顧客が問題解析を気軽にできるようにしたい顧客向けツールとして提供したいつまり顧客環境で動かしたい 1 バイナリ OSS として提供したい Apache-2.0 として公開したいログファイルは大きくても 100 GB は行かないもともと Go + SQLite + JSONB で検討していた SQL で書きたい SQLite ファイルとして書き出したい SQLite ファイルフォーマットは信頼できる S3 などにファイルを置いておくだけにしたいクラウド版に組み込みたい顧客毎に duckdb ファイル作ればいいのでは? duckdb ファ
- DuckDB
- json
- sql
- DB
- ログ
- Rust
- あとで読む
- API
DuckDB メモ v1
DuckDB as the New jq
- 63 users
- www.pgrs.net
- テクノロジー
- 2024年03月22日
Recently, I’ve been interested in the DuckDB project (like a SQLite geared towards data applications). And one of the amazing features is that it has many data importers included without requiring extra dependencies. This means it can natively read and parse JSON as a database table, among many other formats. I work extensively with JSON day to day, and I often reach for jq when exploring document
- duckdb
- JSON
- jq
- db
- sql
- あとで読む
- Pocket
pg_duckdbとDuckLakeがもたらすOLAP統合の未来
- 63 users
- zenn.dev/nttdata_tech
- テクノロジー
- 2025年06月27日
注目を集めるPostgreSQL+Analytics 先日、SnowflakeとDatabricksのそれぞれの年次イベントでPostgreSQLに関連する企業の買収が大々的に発表されました。両社は分析系(OLAP)のソリューションを提供する比較的大きなベンダーであり、過去にはOLTP系への進出を目指したデータストアの開発が注目されたこともありました(SnowflakeのUnistoreが典型です)。彼らは今後、PostgreSQLを自社がカバーできていなかった領域で適用することで、現在のメガクラウドのようにOLTP用途のRDBとOLAPのソリューションを統合してくることが予想されます。そして、多くの利用者を持つオープンソースのPostgreSQL(コミュニティ版と言っても良いかも知れません)においても、OLAPとの統合という流れは今後確実に訪れるというのが、私個人の予想です。今回
pg_duckdbとDuckLakeがもたらすOLAP統合の未来
DuckDB+Evidenceを駆使してISUCON14で21位になった話 - Gマイナー志向
- 56 users
- matsuu.hatenablog.com
- テクノロジー
- 2024年12月14日
2024年12月8日に開催されたISUCON14に「ウー馬場ーイーツ・ザ・ファイナル」として参加しました。最終スコアは29,386でした。実装言語はGoです。こんなPostをしてましたがRustは採用しませんでした(今回は余裕がなかった)。講談社サイエンティフィク様からのご厚意で書籍「RustによるWebアプリケーション開発」をご恵贈いただきました。早速読み進めてます。今年のISUCONはRustで決まりかー!? #PR https://t.co/sOAcWEqE8P pic.twitter.com/cK7V6lPMQk— matsuu (@matsuu) 2024年10月8日今年のチャレンジについて我らがチームはISUCON開催のたびに新たなチャレンジ*1をしてるのですが、今回は以下の4つにチャレンジしました。ログ解析の見直し生成AIの導入 rustlsの導入 bpftune
- DuckDB
- performance
- isucon
- あとで読む
- SQL
- data
DuckDB+Evidenceを駆使してISUCON14で21位になった話 - Gマイナー志向
[新機能] 入力しながら即座にクエリ結果確認ができるInstant SQLをDuckDB Local UIから試してみた | DevelopersIO
- 54 users
- dev.classmethod.jp
- テクノロジー
- 2025年05月11日
はじめにデータ事業本部ビッグデータチームのkasamaです。今回は入力しながらInstant(即座)にクエリ結果を確認できるInstant SQLのPublic PreviewをDuckDB Local UIから試してみたいと思います。今までSQLでCTEを長々と書いてデバッグする際には1つ1つ実行しながら確認するしかなかったのですが、選択箇所を即座に確認できるので、かなり良い機能だと思います。前提 DuckDB Local UIはブラウザでDuckDBを操作できるサービスです。ターミナルから以下のコマンドで起動できます。
- duckdb
- あとで読む
- データ
- ui
- tech
- 技術
- web
[新機能] 入力しながら即座にクエリ結果確認ができるInstant SQLをDuckDB Local UIから試してみた | DevelopersIO
GrafanaでS3に置いてあるログファイルを参照する - くしゃみのちり紙
- 50 users
- heraction.hatenablog.com
- テクノロジー
- 2025年02月17日
きっかけは以下のツイートを見かけたことでした。 Grafana を立てるだけで、S3 にログ保存しておけば、好きなだけグラフが作れる時代が来てしまった。なんということだ。 https://t.co/uuYgm8dLIr— V (@voluntas) 2025年2月13日なにこれ良さそう。GrafanaもDuckDBも全然知らんけど。ということで試してみました。キーアイテム grafana-duckdb-datasourceというGrafanaプラグインを使用します。 github.com 前提 Grafana Version: v11.6.0-82874 (e5b49a406f) Container Image: grafana/grafana-enterprise:main-ubuntu Container OS: Ubuntu 22.04.5 LTS Container CPU
GrafanaでS3に置いてあるログファイルを参照する - くしゃみのちり紙
DuckDB/DuckDB-Wasm と Postgres と S3 を組み合わせるメモ
- 50 users
- zenn.dev/voluntas
- テクノロジー
- 2024年11月10日
モチベーション Postgres は OLTP として利用したい DuckDB は OLAP として利用したい集計を Postgres でやらず、独立した DuckDB でやりたいデータ保存は S3 を利用したい保存先として一番安い一定期間経ったら削除が簡単にできる細かいデータ処理は DuckDB-Wasm を利用してクライアント側のリソースを利用したい一度前処理したデータは S3 に Parquet 形式で置いておきたい転送量ボトルネックに寄せる Cloudflare R2 などを利用すれば転送量はかからなくなる概要 DuckDB は Postgres に直接アクセスできる仕組みを持っている PostgreSQL Extension – DuckDB Postgres のテーブルを DuckDB に持ってこれる COPY でテーブルを Parquet ファイルにすることが
- duckdb
- データベース
- wasm
- PostgreSQL
- 設計
- db
- database
DuckDB/DuckDB-Wasm と Postgres と S3 を組み合わせるメモ
メタデータ管理をデータベースで担う新しいLakehouseフォーマット「DuckLake」が発表されました | DevelopersIO
- 48 users
- dev.classmethod.jp
- テクノロジー
- 2025年05月28日
さがらです。 DuckDBの公式ブログにおいて、メタデータ管理をデータベースで担う新しいLakehouseフォーマット「DuckLake」が発表されました。本記事では、DuckLakeがどういったものか簡単に紹介し、ローカルで軽く触ってみたのでその内容をまとめてみます。 DuckLakeとはまずDuckLakeですが、DuckDBの開発元が開発したOSSのLakehouseフォーマットとなっております。昨今のIcebergやDelta Lakeではファイルベースでメタデータを管理するという複雑性があったことを課題認識し、そのメタデータ管理を担うレイヤーをIcebergでいうカタログレイヤーも含めて全てSQLデータベースで担う方向性で実装したプロダクトが、DuckLakeとなっております。 DuckLakeのメリットとして、以下4つが上述のリンク先のブログで言及されています。 Simp
メタデータ管理をデータベースで担う新しいLakehouseフォーマット「DuckLake」が発表されました | DevelopersIO
DuckDB/DuckDB-Wasm を利用した低コストでの可視化
- 45 users
- zenn.dev/shiguredo
- テクノロジー
- 2024年10月01日
前提ミドルウェアのログ可視化ログサイズは全体で 1 TB 未満ログは jsonl で出力されるまとめ非同期での可視化オフラインでの可視化低コスト DuckDB とはこちらをどうぞ。 DuckDB雑紹介(1.1対応版)@DuckDB座談会 - Speaker Deck サンプルとりあえず動くのが見たい人用です。ソースコードも公開してます。 DuckDB-Wasm + Parquet + S3-compatible object storage + OPFS S3 から Parquet ファイルを fetch して DuckDB-Wasm への登録 OPFS へ Parquet ファイルの保存 OPFS から Parquet ファイルの読み込み DuckDB-Wasm へ登録 SAMPLE 1 の出力 SAMPLE 1 での検索 SAMPLE 1 での Parquet ファイ
- DuckDB
- wasm
- WebAssembly
- あとで読む
- analytics
DuckDB/DuckDB-Wasm を利用した低コストでの可視化
『DuckDB実践入門』が出版されます
- 45 users
- darashi.net
- テクノロジー
- 2025年08月19日
『DuckDB実践入門』が出版されます 2025年08月19日私が翻訳した『DuckDB in Action』の訳書『DuckDB実践入門 PCで使える高速で快適なデータ分析用DB―基本からエコシステム活用まで』が出版される運びとなりました。レビューに参加してくださった皆様 @snoozer05 @kei_s @ktou @hmsk @tmaeda 、編集を担当いただきました石橋克隆様、お力添えくださいましたすべての皆様に感謝します。 DuckDB実践入門 PCで使える高速で快適なデータ分析用DB―基本からエコシステム活用まで (impress top gear) | Mark Needham, Michael Hunger, Michael Simons |本 | 通販 | Amazon DuckDB実践入門 PCで使える高速で快適なデータ分析用DB―基本からエコシステム活用まで -
- duckdb
- あとで読む
- book
- システム
- DB
- データ
- 書籍
『DuckDB実践入門』が出版されます
DuckDB を使ったデータ品質保証の実践 - Timee Product Team Blog
- 40 users
- tech.timee.co.jp
- テクノロジー
- 2024年12月05日
この記事は Timee Advent Calendar 2024 シリーズ 1 の5日目の記事です。はじめにこんにちは。タイミーの DRE チームの chanyou です。2024年の3月に DRE チームにジョインして、社内のデータ基盤を作って運用しています。 DuckDB を使ってデータ基盤で扱うデータの品質を保証し始めたので、その内容をご紹介します。データ品質と完全性タイミーのデータ基盤で重視しているデータ品質タイミーでは、DMBOK を参考に以下のデータ品質を重視して設計や日々の運用を行っています。特性意味完全性データが欠損していないか適時性必要なときにすぐにデータを参照できるか一意性データが重複していないか一貫性型・タイムゾーン・表記揺れなど、値の書式や意味が統一されているか今回は完全性にフォーカスします。完全性が損なわれるタイミング上記の通り
DuckDB を使ったデータ品質保証の実践 - Timee Product Team Blog

1 2 3 次のページ

(追記) (追記ここまで)

検索対象

並び順

ブックマーク数

セーフサーチ

期間指定

絞り込み

検索対象

ブックマーク数

期間

セーフサーチ

DuckDBの検索結果1 - 40 件 / 118件

DuckDBの関連エントリー

DuckDBの関連エントリー

新着記事

キーボードショートカット一覧

公式Twitter

はてなのサービス