เว็บอินเตอร์เฟสสำหรับการแพร่กระจายที่เสถียรใช้โดยใช้ไลบรารี Gradio
คุณสมบัติ
การจัดแสดงคุณสมบัติโดยละเอียดพร้อมรูปภาพ-
- โหมด txt2img และ img2img ดั้งเดิม
- คลิกเดียวติดตั้งและเรียกใช้สคริปต์ (แต่คุณยังต้องติดตั้ง Python และ Git)
- การทำมากกว่า
- การทาสี
- ภาพร่างสี
- พรอมต์เมทริกซ์
- การแพร่กระจายที่เสถียร
- ความสนใจระบุบางส่วนของข้อความที่โมเดลควรให้ความสนใจมากขึ้น
- ผู้ชายใน
((Tuxedo))
- จะให้ความสนใจกับทักซิโด้มากขึ้น - ผู้ชายใน
(Tuxedo: 1.21)
- ไวยากรณ์ทางเลือก - เลือกข้อความและกด
ctrl+up
หรือctrl+down
(หรือคำสั่ง+ขึ้น
หรือคำสั่ง+ลง
หากคุณอยู่ใน macOS) เพื่อปรับความสนใจกับข้อความที่เลือกโดยอัตโนมัติ (รหัสที่สนับสนุนโดยผู้ใช้ที่ไม่ระบุชื่อ) โดยอัตโนมัติ)
- ผู้ชายใน
- วนกลับเรียกใช้การประมวลผล IMG2IMG หลายครั้ง
- พล็อต x/y/z วิธีการวาดภาพ 3 มิติของภาพที่มีพารามิเตอร์ที่แตกต่างกัน
- การผกผัน
- มีการฝังตัวมากเท่าที่คุณต้องการและใช้ชื่อใด ๆ ที่คุณชอบ
- ใช้ embeddings หลายตัวที่มีจำนวนเวกเตอร์ที่แตกต่างกันต่อโทเค็น
- ทำงานกับหมายเลขจุดลอยตัวครึ่งความแม่นยำ
- รถไฟฝังตัวใน 8GB (ยังรายงานการทำงาน 6GB)
- แท็บพิเศษพร้อม:
- Gfpgan เครือข่ายประสาทที่แก้ไขใบหน้า
- CodeFormer เครื่องมือฟื้นฟูใบหน้าเป็นทางเลือกแทน gfpgan
- Realesrgan, Neural Network Upscaler
- Esrgan, Neural Network Upscaler ที่มีโมเดลบุคคลที่สามจำนวนมาก
- Swinir และ Swin2SR (ดูที่นี่) ผู้สูงอายุเครือข่ายประสาท
- LDSR, แฝงการแพร่กระจายการปรับอัตราการปรับขนาด
- การปรับขนาดตัวเลือกอัตราส่วนภาพ
- การเลือกวิธีการสุ่มตัวอย่าง
- ปรับค่า ETA Sampler (ตัวคูณสัญญาณรบกวน)
- ตัวเลือกการตั้งค่าเสียงขั้นสูงเพิ่มเติม
- การประมวลผลขัดจังหวะได้ตลอดเวลา
- การสนับสนุนการ์ดวิดีโอ 4GB (ยังรายงานการทำงาน 2GB)
- ถูกต้องเมล็ดสำหรับแบทช์
- การตรวจสอบความยาวโทเค็นสด
- พารามิเตอร์การสร้าง
- พารามิเตอร์ที่คุณใช้ในการสร้างภาพจะถูกบันทึกด้วยภาพนั้น
- ใน PNG Chunks สำหรับ PNG ใน exif สำหรับ jpeg
- สามารถลากภาพไปยังแท็บข้อมูล PNG เพื่อกู้คืนพารามิเตอร์การสร้างและคัดลอกไปยัง UI โดยอัตโนมัติ
- สามารถปิดใช้งานได้ในการตั้งค่า
- ลากและวางอิมเมจ/พารามิเตอร์ข้อความไปยัง ProftingBox
- ปุ่มอ่านพารามิเตอร์การสร้าง, โหลดพารามิเตอร์ใน PromptBox ไปยัง UI
- หน้าการตั้งค่า
- เรียกใช้รหัส Python โดยพลการจาก UI (ต้องทำงานด้วย
-รหัสโลว์
การเปิดใช้งาน) - คำแนะนำของ Mouseover สำหรับองค์ประกอบ UI ส่วนใหญ่
- เป็นไปได้ที่จะเปลี่ยนค่าเริ่มต้น/mix/max/step สำหรับองค์ประกอบ UI ผ่านการกำหนดค่าข้อความ
- รองรับการปูกระเบื้องช่องทำเครื่องหมายเพื่อสร้างรูปภาพที่สามารถเรียงต่อกันได้เช่นพื้นผิว
- Progress Bar และ Preview Preview การสร้างภาพสด
- สามารถใช้เครือข่ายประสาทแยกต่างหากเพื่อสร้างตัวอย่างที่ไม่มีข้อกำหนด VRAM หรือการคำนวณเกือบทั้งหมด
- พรอมต์เชิงลบฟิลด์ข้อความพิเศษที่ช่วยให้คุณแสดงรายการสิ่งที่คุณไม่ต้องการดูในภาพที่สร้างขึ้น
- สไตล์วิธีการบันทึกส่วนหนึ่งของพรอมต์และนำไปใช้อย่างง่ายดายผ่านแบบดรอปดาวน์ในภายหลัง
- รูปแบบวิธีสร้างภาพเดียวกัน แต่มีความแตกต่างเล็กน้อย
- การปรับขนาดเมล็ดวิธีสร้างภาพเดียวกัน แต่มีความละเอียดแตกต่างกันเล็กน้อย
- Clip Interrogator ปุ่มที่พยายามเดาพรอมต์จากภาพ
- การแก้ไขอย่างรวดเร็ววิธีที่จะเปลี่ยนช่วงกลางยุคใหม่พูดเพื่อเริ่มทำแตงโมและเปลี่ยนเป็นสาวอนิเมะมิดเวย์
- การประมวลผลแบบแบตช์ประมวลผลกลุ่มของไฟล์โดยใช้ IMG2IMG
- img2img ทางเลือกวิธีออยเลอร์ย้อนกลับของการควบคุมความสนใจข้าม
- Highres Fix ตัวเลือกความสะดวกสบายในการสร้างรูปภาพความละเอียดสูงในคลิกเดียวโดยไม่บิดเบือนปกติ
- การโหลดจุดตรวจสอบใหม่ได้ทันที
- การควบรวมจุดตรวจสอบแท็บที่ช่วยให้คุณสามารถรวมจุดตรวจได้สูงสุด 3 จุดเข้าด้วยกัน
- สคริปต์ที่กำหนดเองด้วยส่วนขยายมากมายจากชุมชน
- การแต่งเพลงวิธีใช้หลายพรอมต์พร้อมกัน
- แยกพรอมต์โดยใช้ตัวพิมพ์ใหญ่
และ
- ยังรองรับน้ำหนักสำหรับพรอมต์:
แมว: 1.2 และสุนัขและเพนกวิน: 2.2
- แยกพรอมต์โดยใช้ตัวพิมพ์ใหญ่
- ไม่มีการ จำกัด โทเค็นสำหรับการแจ้งเตือน (การแพร่กระจายที่มั่นคงดั้งเดิมให้คุณใช้โทเค็นได้สูงสุด 75 โท)
- การรวม DeepDanBooru สร้างแท็กสไตล์ Danbooru สำหรับการแจ้งเตือนอนิเมะ
- xformersเพิ่มความเร็วหลักสำหรับการ์ดที่เลือก: (เพิ่ม
-xformers
ถึงคำสั่ง args) - ผ่านส่วนขยาย:แท็บประวัติศาสตร์: ดูภาพตรงและลบภาพภายใน UI ได้อย่างสะดวกสบาย
- สร้างตัวเลือกตลอดกาล
- แท็บฝึกอบรม
- ตัวเลือก Hypernetworks และ Embeddings
- ภาพการประมวลผลล่วงหน้า: การครอบตัด, การทำมิเรอร์, การติดแท็กอัตโนมัติโดยใช้ blip หรือ deepdanbooru (สำหรับอนิเมะ)
- คลิปข้าม
- Hypernetworks
- Loras (เหมือนกับ Hypernetworks แต่สวยกว่า)
- UI แยกต่างหากที่คุณสามารถเลือกได้ด้วยการแสดงตัวอย่างซึ่ง Embeddings, Hypernetworks หรือ Loras เพื่อเพิ่มลงในพรอมต์ของคุณ
- สามารถเลือกเพื่อโหลด VAE อื่นจากหน้าจอการตั้งค่า
- เวลาที่เสร็จสมบูรณ์ในแถบความคืบหน้า
- API
- สนับสนุนเฉพาะรูปแบบการทาสีโดย runwayml
- ผ่านส่วนขยาย:การไล่ระดับสีสุนทรียศาสตร์วิธีสร้างภาพที่มีความสวยงามเฉพาะโดยใช้ภาพคลิปที่ฝัง (การใช้งานของhttps://github.com/vicgalle/stable-diffusion-aesthetic-gradients-
- การแพร่กระจายที่มั่นคง 2.0สนับสนุน - ดูวิกิสำหรับคำแนะนำ
- การเสียดสีสนับสนุน - ดูวิกิสำหรับคำแนะนำ
- ตอนนี้ไม่มีจดหมายที่ไม่ดี!
- จุดตรวจสอบในรูปแบบ safetensors
- ข้อ จำกัด การแก้ปัญหาที่ผ่อนคลายลง: ขนาดของภาพที่สร้างขึ้นจะต้องเป็นหลาย 8 มากกว่า 64
- ตอนนี้มีใบอนุญาต!
- จัดลำดับองค์ประกอบใหม่ในหน้าจอ UI จากการตั้งค่า
- Segmind การแพร่กระจายที่มั่นคงสนับสนุน
การติดตั้งและทำงาน
ตรวจสอบให้แน่ใจว่าจำเป็นการพึ่งพาอาศัยกันได้พบและทำตามคำแนะนำที่มีอยู่สำหรับ:
- Nvidia(ที่แนะนำ)
- เอเอ็มดีGPU
- Intel CPU, Intel GPU (ทั้งแบบบูรณาการและไม่ต่อเนื่อง)(หน้าวิกิภายนอก)
- ขึ้น NPUS(หน้าวิกิภายนอก)
หรือใช้บริการออนไลน์ (เช่น Google Colab):
การติดตั้งบน Windows 10/11 ด้วย Nvidia-GPUS โดยใช้แพ็คเกจรีลีส
- การดาวน์โหลด
sd.webui.zip
จากv1.0.0-forและแยกเนื้อหา - วิ่ง
Update.bat
- - วิ่ง
run.bat
-
สำหรับรายละเอียดเพิ่มเติมดูติดตั้งและดำเนินการ
การติดตั้งอัตโนมัติบน Windows
- ติดตั้งPython 3.10.6(Python รุ่นใหม่ไม่รองรับคบเพลิง) ตรวจสอบ "เพิ่ม Python ไปยัง Path"
- ติดตั้งกระตวน-
- ดาวน์โหลดพื้นที่เก็บข้อมูลที่มีความเสถียร
git clone https://github.com/automatic1111/stable-diffusion-webui.git
- - วิ่ง
webi-user.bat
จาก Windows Explorer ตามปกติผู้ใช้ที่ไม่ใช่ผู้ดูแลระบบ
การติดตั้งอัตโนมัติบน Linux
- ติดตั้งการอ้างอิง:
-อิงตาม Debian:sudo apt ติดตั้ง wget git python3 python3-venv libgl1 libglib2.0-0-Red Hat-based:sudo dnf ติดตั้ง wget git python3 gperftools-libs libglvnd-glx-OpenSuse-based:sudo zypper ติดตั้ง wget git python3 libtcmalloc4 libglvnd-arch-based:sudo pacman -s wget git python3
- นำทางไปยังไดเรกทอรีที่คุณต้องการให้ WebUI ติดตั้งและดำเนินการคำสั่งต่อไปนี้:
wget -q https://raw.githubusercontent.com/automatic1111/stable-diffusion-webui/master/webui.sh
- วิ่ง
เว็บบุย.ช
- - ตรวจสอบ
webui-user.sh
สำหรับตัวเลือก
การติดตั้งบน Apple Silicon
ค้นหาคำแนะนำที่นี่-
การบริจาค
นี่คือวิธีเพิ่มรหัสลงใน repo นี้:การบริจาค
เอกสาร
เอกสารถูกย้ายจาก readme นี้ไปยังโครงการวิกิ-
เพื่อจุดประสงค์ในการรับ Google และเครื่องมือค้นหาอื่น ๆ เพื่อรวบรวมข้อมูลวิกินี่คือลิงค์ไปยัง (ไม่ใช่สำหรับมนุษย์)วิกิที่รวบรวมได้-
การให้เครดิต
ใบอนุญาตสำหรับรหัสยืมสามารถพบได้ในการตั้งค่า -> ใบอนุญาต
หน้าจอและในhtml/licenses.html
ไฟล์.
- การแพร่กระจายที่มั่นคง -https://github.com/Stability-AI/stablediffusion-https://github.com/CompVis/taming-transformers
- K -diffusion -https://github.com/crowsonkb/k-diffusion.git
- Spandrel -https://github.com/chaiNNer-org/spandrelการดำเนินการ
- gfpgan -https://github.com/TencentARC/GFPGAN.git
- CodeFormer -https://github.com/sczhou/CodeFormer
- Esrgan -https://github.com/xinntao/ESRGAN
- Swinir -https://github.com/JingyunLiang/SwinIR
- Sweyar -https://github.com/mv-lab/swin2sr
- LDSR -https://github.com/Hafiidz/latent-diffusion
- Midas -https://github.com/isl-org/MiDaS
- แนวคิดสำหรับการเพิ่มประสิทธิภาพ -https://github.com/basujindal/stable-diffusion
- การเพิ่มประสิทธิภาพเลเยอร์ความสนใจข้าม - doggettx -https://github.com/Doggettx/stable-diffusionแนวคิดดั้งเดิมสำหรับการแก้ไขที่รวดเร็ว
- การเพิ่มประสิทธิภาพเลเยอร์ความสนใจข้าม - Invokeai, Lstein -https://github.com/invoid-ai/InvoidAI(เดิมทีhttp://github.com/lstein/stable-diffusion-
- การเพิ่มประสิทธิภาพเลเยอร์ความสนใจแบบควอชชันแบบ Quadratic - Alex Birch (เบิร์ช-ซัง/diffusers#1), Amin Rezaei (https://github.com/AminRezaei0x443/memory-efficient-attention-
- การผกผันของข้อความ - Rinon Gal -https://github.com/rinongal/textual_inversion(เราไม่ได้ใช้รหัสของเขา แต่เราใช้ความคิดของเขา)
- แนวคิดสำหรับ SD Upscale -https://github.com/jquesnelle/txt2imghd
- การสร้างเสียงรบกวนสำหรับ Mk2 -https://github.com/parlance-zz/g-diffuser-bot
- คลิปแนวคิดเกี่ยวกับการซักถามและยืมรหัสบางส่วน -https://github.com/pharmapsychotic/clip-interrogator
- แนวคิดสำหรับการแพร่กระจายแบบคอมโพสิต -https://github.com/energy-based-model/Compositional-Visual-Generation-with-Composable-Diffusion-Models-PyTorch
- xformers -https://github.com/facebookresearch/xformers
- DeepDanBooru - ผู้สอบสวนสำหรับ diffusers อะนิเมะhttps://github.com/KichangKim/DeepDanbooru
- การสุ่มตัวอย่างในความแม่นยำ float32 จาก float16 unet - marunine สำหรับความคิด, เบิร์ชซังสำหรับตัวอย่างการใช้งาน diffusers (https://github.com/Birch-san/diffusers-play/tree/92feee6-
- สั่ง PIX2PIX - Tim Brooks (Star), Aleksander Holynski (Star), Alexei A. Efros (ไม่มี Star) -https://github.com/timothybrooks/instruct-pix2pix
- คำแนะนำด้านความปลอดภัย - Ryotak
- UN IPC Sampler -wen สอง zhao-https://github.com/wl-zhao/UniPC
- ta esd -ol lin boer bohttps://github.com/madebyollin/taesd
- Lycoris - Kohakublueleaf
- การสุ่มตัวอย่างรีสตาร์ท - Lambertae -https://github.com/Newbeeer/diffusion_restart_sampling
- hypertile - tfernd -https://github.com/tfernd/HyperTile
- สคริปต์เริ่มต้นเริ่มต้น - โพสต์บน 4chan โดยผู้ใช้ที่ไม่ระบุชื่อขอบคุณผู้ใช้ที่ไม่ระบุชื่อ
- (คุณ)
เกี่ยวกับ
เว็บการแพร่กระจายที่เสถียร UI
GNU ทั่วไปใบอนุญาตสาธารณะ v3.0
ภาษา
ภาษา:งูหลาม86.9%ภาษา:จาวาสคริปต์8.8%ภาษา:CSS2.2%ภาษา:HTML1.4%ภาษา:เปลือก0.7%ภาษา:ไฟล์ชุด0.1%