Endaye/Stable-Diffusion-Webui (2024)

เว็บอินเตอร์เฟสสำหรับการแพร่กระจายที่เสถียรใช้โดยใช้ไลบรารี Gradio

คุณสมบัติ

การจัดแสดงคุณสมบัติโดยละเอียดพร้อมรูปภาพ-

โหมด txt2img และ img2img ดั้งเดิม
คลิกเดียวติดตั้งและเรียกใช้สคริปต์ (แต่คุณยังต้องติดตั้ง Python และ Git)
การทำมากกว่า
การทาสี
ภาพร่างสี
พรอมต์เมทริกซ์
การแพร่กระจายที่เสถียร
ความสนใจระบุบางส่วนของข้อความที่โมเดลควรให้ความสนใจมากขึ้น
- ผู้ชายใน((Tuxedo))- จะให้ความสนใจกับทักซิโด้มากขึ้น
- ผู้ชายใน(Tuxedo: 1.21)- ไวยากรณ์ทางเลือก
- เลือกข้อความและกดctrl+upหรือctrl+down(หรือคำสั่ง+ขึ้นหรือคำสั่ง+ลงหากคุณอยู่ใน macOS) เพื่อปรับความสนใจกับข้อความที่เลือกโดยอัตโนมัติ (รหัสที่สนับสนุนโดยผู้ใช้ที่ไม่ระบุชื่อ) โดยอัตโนมัติ)
วนกลับเรียกใช้การประมวลผล IMG2IMG หลายครั้ง
พล็อต x/y/z วิธีการวาดภาพ 3 มิติของภาพที่มีพารามิเตอร์ที่แตกต่างกัน
การผกผัน
- มีการฝังตัวมากเท่าที่คุณต้องการและใช้ชื่อใด ๆ ที่คุณชอบ
- ใช้ embeddings หลายตัวที่มีจำนวนเวกเตอร์ที่แตกต่างกันต่อโทเค็น
- ทำงานกับหมายเลขจุดลอยตัวครึ่งความแม่นยำ
- รถไฟฝังตัวใน 8GB (ยังรายงานการทำงาน 6GB)
แท็บพิเศษพร้อม:
- Gfpgan เครือข่ายประสาทที่แก้ไขใบหน้า
- CodeFormer เครื่องมือฟื้นฟูใบหน้าเป็นทางเลือกแทน gfpgan
- Realesrgan, Neural Network Upscaler
- Esrgan, Neural Network Upscaler ที่มีโมเดลบุคคลที่สามจำนวนมาก
- Swinir และ Swin2SR (ดูที่นี่) ผู้สูงอายุเครือข่ายประสาท
- LDSR, แฝงการแพร่กระจายการปรับอัตราการปรับขนาด
การปรับขนาดตัวเลือกอัตราส่วนภาพ
การเลือกวิธีการสุ่มตัวอย่าง
- ปรับค่า ETA Sampler (ตัวคูณสัญญาณรบกวน)
- ตัวเลือกการตั้งค่าเสียงขั้นสูงเพิ่มเติม
การประมวลผลขัดจังหวะได้ตลอดเวลา
การสนับสนุนการ์ดวิดีโอ 4GB (ยังรายงานการทำงาน 2GB)
ถูกต้องเมล็ดสำหรับแบทช์
การตรวจสอบความยาวโทเค็นสด
พารามิเตอร์การสร้าง
- พารามิเตอร์ที่คุณใช้ในการสร้างภาพจะถูกบันทึกด้วยภาพนั้น
- ใน PNG Chunks สำหรับ PNG ใน exif สำหรับ jpeg
- สามารถลากภาพไปยังแท็บข้อมูล PNG เพื่อกู้คืนพารามิเตอร์การสร้างและคัดลอกไปยัง UI โดยอัตโนมัติ
- สามารถปิดใช้งานได้ในการตั้งค่า
- ลากและวางอิมเมจ/พารามิเตอร์ข้อความไปยัง ProftingBox
ปุ่มอ่านพารามิเตอร์การสร้าง, โหลดพารามิเตอร์ใน PromptBox ไปยัง UI
หน้าการตั้งค่า
เรียกใช้รหัส Python โดยพลการจาก UI (ต้องทำงานด้วย-รหัสโลว์การเปิดใช้งาน)
คำแนะนำของ Mouseover สำหรับองค์ประกอบ UI ส่วนใหญ่
เป็นไปได้ที่จะเปลี่ยนค่าเริ่มต้น/mix/max/step สำหรับองค์ประกอบ UI ผ่านการกำหนดค่าข้อความ
รองรับการปูกระเบื้องช่องทำเครื่องหมายเพื่อสร้างรูปภาพที่สามารถเรียงต่อกันได้เช่นพื้นผิว
Progress Bar และ Preview Preview การสร้างภาพสด
- สามารถใช้เครือข่ายประสาทแยกต่างหากเพื่อสร้างตัวอย่างที่ไม่มีข้อกำหนด VRAM หรือการคำนวณเกือบทั้งหมด
พรอมต์เชิงลบฟิลด์ข้อความพิเศษที่ช่วยให้คุณแสดงรายการสิ่งที่คุณไม่ต้องการดูในภาพที่สร้างขึ้น
สไตล์วิธีการบันทึกส่วนหนึ่งของพรอมต์และนำไปใช้อย่างง่ายดายผ่านแบบดรอปดาวน์ในภายหลัง
รูปแบบวิธีสร้างภาพเดียวกัน แต่มีความแตกต่างเล็กน้อย
การปรับขนาดเมล็ดวิธีสร้างภาพเดียวกัน แต่มีความละเอียดแตกต่างกันเล็กน้อย
Clip Interrogator ปุ่มที่พยายามเดาพรอมต์จากภาพ
การแก้ไขอย่างรวดเร็ววิธีที่จะเปลี่ยนช่วงกลางยุคใหม่พูดเพื่อเริ่มทำแตงโมและเปลี่ยนเป็นสาวอนิเมะมิดเวย์
การประมวลผลแบบแบตช์ประมวลผลกลุ่มของไฟล์โดยใช้ IMG2IMG
img2img ทางเลือกวิธีออยเลอร์ย้อนกลับของการควบคุมความสนใจข้าม
Highres Fix ตัวเลือกความสะดวกสบายในการสร้างรูปภาพความละเอียดสูงในคลิกเดียวโดยไม่บิดเบือนปกติ
การโหลดจุดตรวจสอบใหม่ได้ทันที
การควบรวมจุดตรวจสอบแท็บที่ช่วยให้คุณสามารถรวมจุดตรวจได้สูงสุด 3 จุดเข้าด้วยกัน
สคริปต์ที่กำหนดเองด้วยส่วนขยายมากมายจากชุมชน
การแต่งเพลงวิธีใช้หลายพรอมต์พร้อมกัน
- แยกพรอมต์โดยใช้ตัวพิมพ์ใหญ่และ
- ยังรองรับน้ำหนักสำหรับพรอมต์:แมว: 1.2 และสุนัขและเพนกวิน: 2.2
ไม่มีการ จำกัด โทเค็นสำหรับการแจ้งเตือน (การแพร่กระจายที่มั่นคงดั้งเดิมให้คุณใช้โทเค็นได้สูงสุด 75 โท)
การรวม DeepDanBooru สร้างแท็กสไตล์ Danbooru สำหรับการแจ้งเตือนอนิเมะ
xformersเพิ่มความเร็วหลักสำหรับการ์ดที่เลือก: (เพิ่ม-xformersถึงคำสั่ง args)
ผ่านส่วนขยาย:แท็บประวัติศาสตร์: ดูภาพตรงและลบภาพภายใน UI ได้อย่างสะดวกสบาย
สร้างตัวเลือกตลอดกาล
แท็บฝึกอบรม
- ตัวเลือก Hypernetworks และ Embeddings
- ภาพการประมวลผลล่วงหน้า: การครอบตัด, การทำมิเรอร์, การติดแท็กอัตโนมัติโดยใช้ blip หรือ deepdanbooru (สำหรับอนิเมะ)
คลิปข้าม
Hypernetworks
Loras (เหมือนกับ Hypernetworks แต่สวยกว่า)
UI แยกต่างหากที่คุณสามารถเลือกได้ด้วยการแสดงตัวอย่างซึ่ง Embeddings, Hypernetworks หรือ Loras เพื่อเพิ่มลงในพรอมต์ของคุณ
สามารถเลือกเพื่อโหลด VAE อื่นจากหน้าจอการตั้งค่า
เวลาที่เสร็จสมบูรณ์ในแถบความคืบหน้า
API
สนับสนุนเฉพาะรูปแบบการทาสีโดย runwayml
ผ่านส่วนขยาย:การไล่ระดับสีสุนทรียศาสตร์วิธีสร้างภาพที่มีความสวยงามเฉพาะโดยใช้ภาพคลิปที่ฝัง (การใช้งานของhttps://github.com/vicgalle/stable-diffusion-aesthetic-gradients-
การแพร่กระจายที่มั่นคง 2.0สนับสนุน - ดูวิกิสำหรับคำแนะนำ
การเสียดสีสนับสนุน - ดูวิกิสำหรับคำแนะนำ
ตอนนี้ไม่มีจดหมายที่ไม่ดี!
จุดตรวจสอบในรูปแบบ safetensors
ข้อ จำกัด การแก้ปัญหาที่ผ่อนคลายลง: ขนาดของภาพที่สร้างขึ้นจะต้องเป็นหลาย 8 มากกว่า 64
ตอนนี้มีใบอนุญาต!
จัดลำดับองค์ประกอบใหม่ในหน้าจอ UI จากการตั้งค่า
Segmind การแพร่กระจายที่มั่นคงสนับสนุน

การติดตั้งและทำงาน

ตรวจสอบให้แน่ใจว่าจำเป็นการพึ่งพาอาศัยกันได้พบและทำตามคำแนะนำที่มีอยู่สำหรับ:

การติดตั้งบน Windows 10/11 ด้วย Nvidia-GPUS โดยใช้แพ็คเกจรีลีส

การดาวน์โหลดsd.webui.zipจากv1.0.0-forและแยกเนื้อหา
วิ่งUpdate.bat-
วิ่งrun.bat-

สำหรับรายละเอียดเพิ่มเติมดูติดตั้งและดำเนินการ

การติดตั้งอัตโนมัติบน Windows

ติดตั้งPython 3.10.6(Python รุ่นใหม่ไม่รองรับคบเพลิง) ตรวจสอบ "เพิ่ม Python ไปยัง Path"
ติดตั้งกระตวน-
ดาวน์โหลดพื้นที่เก็บข้อมูลที่มีความเสถียรgit clone https://github.com/automatic1111/stable-diffusion-webui.git-
วิ่งwebi-user.batจาก Windows Explorer ตามปกติผู้ใช้ที่ไม่ใช่ผู้ดูแลระบบ

การติดตั้งอัตโนมัติบน Linux

ติดตั้งการอ้างอิง:

-อิงตาม Debian:sudo apt ติดตั้ง wget git python3 python3-venv libgl1 libglib2.0-0-Red Hat-based:sudo dnf ติดตั้ง wget git python3 gperftools-libs libglvnd-glx-OpenSuse-based:sudo zypper ติดตั้ง wget git python3 libtcmalloc4 libglvnd-arch-based:sudo pacman -s wget git python3

นำทางไปยังไดเรกทอรีที่คุณต้องการให้ WebUI ติดตั้งและดำเนินการคำสั่งต่อไปนี้:

wget -q https://raw.githubusercontent.com/automatic1111/stable-diffusion-webui/master/webui.sh

วิ่งเว็บบุย.ช-
ตรวจสอบwebui-user.shสำหรับตัวเลือก

การติดตั้งบน Apple Silicon

ค้นหาคำแนะนำที่นี่-

การบริจาค

นี่คือวิธีเพิ่มรหัสลงใน repo นี้:การบริจาค

เอกสาร

เอกสารถูกย้ายจาก readme นี้ไปยังโครงการวิกิ-

เพื่อจุดประสงค์ในการรับ Google และเครื่องมือค้นหาอื่น ๆ เพื่อรวบรวมข้อมูลวิกินี่คือลิงค์ไปยัง (ไม่ใช่สำหรับมนุษย์)วิกิที่รวบรวมได้-

การให้เครดิต

ใบอนุญาตสำหรับรหัสยืมสามารถพบได้ในการตั้งค่า -> ใบอนุญาตหน้าจอและในhtml/licenses.htmlไฟล์.

การแพร่กระจายที่มั่นคง -https://github.com/Stability-AI/stablediffusion-https://github.com/CompVis/taming-transformers
K -diffusion -https://github.com/crowsonkb/k-diffusion.git
Spandrel -https://github.com/chaiNNer-org/spandrelการดำเนินการ
- gfpgan -https://github.com/TencentARC/GFPGAN.git
- CodeFormer -https://github.com/sczhou/CodeFormer
- Esrgan -https://github.com/xinntao/ESRGAN
- Swinir -https://github.com/JingyunLiang/SwinIR
- Sweyar -https://github.com/mv-lab/swin2sr
LDSR -https://github.com/Hafiidz/latent-diffusion
Midas -https://github.com/isl-org/MiDaS
แนวคิดสำหรับการเพิ่มประสิทธิภาพ -https://github.com/basujindal/stable-diffusion
การเพิ่มประสิทธิภาพเลเยอร์ความสนใจข้าม - doggettx -https://github.com/Doggettx/stable-diffusionแนวคิดดั้งเดิมสำหรับการแก้ไขที่รวดเร็ว
การเพิ่มประสิทธิภาพเลเยอร์ความสนใจข้าม - Invokeai, Lstein -https://github.com/invoid-ai/InvoidAI(เดิมทีhttp://github.com/lstein/stable-diffusion-
การเพิ่มประสิทธิภาพเลเยอร์ความสนใจแบบควอชชันแบบ Quadratic - Alex Birch (เบิร์ช-ซัง/diffusers#1), Amin Rezaei (https://github.com/AminRezaei0x443/memory-efficient-attention-
การผกผันของข้อความ - Rinon Gal -https://github.com/rinongal/textual_inversion(เราไม่ได้ใช้รหัสของเขา แต่เราใช้ความคิดของเขา)
แนวคิดสำหรับ SD Upscale -https://github.com/jquesnelle/txt2imghd
การสร้างเสียงรบกวนสำหรับ Mk2 -https://github.com/parlance-zz/g-diffuser-bot
คลิปแนวคิดเกี่ยวกับการซักถามและยืมรหัสบางส่วน -https://github.com/pharmapsychotic/clip-interrogator
แนวคิดสำหรับการแพร่กระจายแบบคอมโพสิต -https://github.com/energy-based-model/Compositional-Visual-Generation-with-Composable-Diffusion-Models-PyTorch
xformers -https://github.com/facebookresearch/xformers
DeepDanBooru - ผู้สอบสวนสำหรับ diffusers อะนิเมะhttps://github.com/KichangKim/DeepDanbooru
การสุ่มตัวอย่างในความแม่นยำ float32 จาก float16 unet - marunine สำหรับความคิด, เบิร์ชซังสำหรับตัวอย่างการใช้งาน diffusers (https://github.com/Birch-san/diffusers-play/tree/92feee6-
สั่ง PIX2PIX - Tim Brooks (Star), Aleksander Holynski (Star), Alexei A. Efros (ไม่มี Star) -https://github.com/timothybrooks/instruct-pix2pix
คำแนะนำด้านความปลอดภัย - Ryotak
UN IPC Sampler -wen สอง zhao-https://github.com/wl-zhao/UniPC
ta esd -ol lin boer bohttps://github.com/madebyollin/taesd
Lycoris - Kohakublueleaf
การสุ่มตัวอย่างรีสตาร์ท - Lambertae -https://github.com/Newbeeer/diffusion_restart_sampling
hypertile - tfernd -https://github.com/tfernd/HyperTile
สคริปต์เริ่มต้นเริ่มต้น - โพสต์บน 4chan โดยผู้ใช้ที่ไม่ระบุชื่อขอบคุณผู้ใช้ที่ไม่ระบุชื่อ
(คุณ)

เกี่ยวกับ

เว็บการแพร่กระจายที่เสถียร UI

GNU ทั่วไปใบอนุญาตสาธารณะ v3.0

ภาษา

ภาษา:งูหลาม86.9%ภาษา:จาวาสคริปต์8.8%ภาษา:CSS2.2%ภาษา:HTML1.4%ภาษา:เปลือก0.7%ภาษา:ไฟล์ชุด0.1%