日本のカラオケ店の、部屋の風景を学習させたLoRAです。
This LoRA is a trained karaoke room scene from a Japanese karaoke shop.
その後、培った経験を基に1から学習をやり直してみました。
V2の主な特徴
トリガー: karaokeroom
JOYPAD JOYSOUNDのキョクナビjoypadっぽいもの
DENMOKU でDAMのスマートデンモクっぽいもの
microphone でカラオケでよく見るワイヤレスマイクが描かれます
AT-CLM7000TX, microphone, だとオーディオテクニカAT-CLM7000TXが描かれる確率が上がります。
WM-610,microphone, だと JOYSOUND純正ワイヤレスマイクWM-610が描かれる確率が上がります。
DYNMIC, microphone, microphone stand, だと、SHURE SM58+マイクスタンド持ち込み可能…かもしれません。(マイクがおかしくなったり、ケーブルが消失したり、マイクスタンド変形しがちで、思ったように描いてくれません。無念。自分のマイクとマイクスタンドや楽器持ち込みのカラオケは楽しいんだけどなぁ…)
ドリンクバーのグラスがテーブルの上に勝手に配備されたりします。プロンプトでグラスとかストローとか書くと、グラスを手にして盛り上がりだしたりします。
キャラクターの描写や画風に影響が生じます。Weightは調整して使って下さい。
This will affect the depiction of the character and the style of the painting. Adjust the Weight.
V2-MIDD_ResizeDIM8 / V2-0008-MID5_ResizeDIM8の特徴
カラオケ屋さんで撮った写真を学習用素材にしている関係で、2Dイラスト系モデルを使っても2.5D化したりリアル化してしまう傾向があります。
できるだけキャラへの塗り等の影響を抑えようとLoRA Block WeightでU-netの層ごとの働きを調べ、Supermergerで一部の層部分のみを取り出したLoRAを作成しました。
MIDD:0,0,0,0,1,1,1,1,1,1,1,1,0,0,0,0,0
MID5:0,0,0,0,0,0,0,1,1,1,1,0,0,0,0,0,0
その上でSD-Scriptsのリサイズスクリプトを使ってDIMサイズをDIM8にリサイズしたものがこの2種類になります。
画風への影響は抑えたことで、肝心の背景のカラオケ機器やJOYPADやデンモク・マイク等の小物のリアルさも表現されなくなってしまいますが、イラスト作成ではこちらの方が使いやすいケースもあるかと思います。使用するモデルやお好みで各バージョンを使い分けしていただければと思います。
SDXL版も試作してみました!