end0tknr's kipple - web写経開発

太宰府天満宮の狛犬って、妙にカワイイ

2024-05-01から1ヶ月間の記事一覧

openpyxl + pillow for python で excelに含まれる画像を抽出

import openpyxl import PIL def main(): excel_file = './test_includeing_img.xlsx' wb = openpyxl.load_workbook(excel_file) for xlsx_img in wb['Sheet1']._images: #print( xlsx_img.path ) # sheet中の座標 print( xlsx_img.anchor._from.col, xlsx_i…

TD-IDF (Term Frequency – Inverse Document Frequency) をpythonで実装

scikit-learn for pythonに頼っていましたが、実装してみました import math import collections def main(): """ TF-IDFとは? 各文書(document)にある各単語(term)が「その文書でどれくらい重要か」 https://atmarkit.itmedia.co.jp/ait/articles/2112/23/…

sqlite fts4 + sql.js によるブラウザでの全文検索

sql.jsは sqlite の javascript + web assembly版ですので、 先程のentryの続きとして、ブラウザでの全文検索を行います。 参考url SQLite FTS : trigram tokenizerでunigram&bigram検索までサポート-日本語全文検索 – スペース・アイ株式会社 【Python】SQ…

SQLite FTS5 Extension による全文検索

参考url 【Python】SQLite で日本語を全文検索するコード例【N-Gram, FTS4/FTS5】 | シラベルノート SQLite FTS5 Extension SQLite FTS : trigram tokenizerでunigram&bigram検索までサポート-日本語全文検索 – スペース・アイ株式会社 SQLite FTS5 拡張機…

kuromoji.js へのユーザ辞書追加

先程のentryの続きです 参考url [JavaScript] kuromoji.js の辞書に単語を追加する | 「それなら猫の手で」 kuromoji.js + UniDic で形態素解析(辞書のビルド) #JavaScript - Qiita kuromoji.js + SudachiDict で形態素解析(辞書のビルド、IPADic・UniDic…

kuromoji.js - javascript版 形態素解析

sudachipy for python (miniconda for win)による sudachiユーザ辞書作成 - end0tknr's kipple - web写経開発 sudachipy for python による sudachiユーザ辞書の利用 (形態素解析) - end0tknr's kipple - web写経開発 python版の形態素解析は、以前、上記ent…

microsoft listに添付されたexcelファイルをseleniumでダウンロード

Office365 (microsoft365)のmicrosoft listに添付されたexcelのリンクをクリックすると、 ファイルダウンロードにはならず、まずは、excel for webで起動されます。 selenium for pythonで excel for web からexcelファイルのダウンロードを 試みましたが、…

Re:区再編に伴う全国地方公共団体コードの変更について

「区名・区域に変更のない天竜区のコードも変更」のようなケースで 市区町村コードが変わっていて驚きました https://www.city.hamamatsu.shizuoka.jp/ksh/imf/tkdk.html CODE 名称 old 22140-6 静岡県 浜松市天竜区 new 22137-6 〃